№21: Знак прысутнасці

№21: Знак прысутнасці

Мы прысвячаем новы нумар “ПрайдзіСвета” феномену сувязі літаратуры і гомасэксуальнасці, альбо, кажучы мовай ХХІ стагоддзя, сувязі літаратуры і ЛГБТК. Ці застаецца літаратура літаратурай, калі адкрывае нам сусвет цялеснасці, сэксуальнасці, інтымнасці? Чаму беларуская літаратура моцная ў апісанні вайны і такая бездапаможная, стэрыльная ў апісанні цялеснасці і сэксуальнасці? Ці існуе беларуская ЛГБТК-літаратура? На гэтыя і іншыя пытанні можна будзе знайсці адказы ў нумары

Чытаць далей

Як дапамагчы свету, калі ты не бот

17 снежня 2011

Як дапамагчы свету, калі ты не бот
Праграма распазнавання робатаў reCaptcha выдае слова з кнігі, якую аблічбоўваюць, а адукацыйны сайт Duolingo прапануе перакладаць артыкулы з Вікіпедыі на іншыя мовы.

Усім інтэрнэт-карыстальнікам даводзіцца час ад часу даказваць, што яны не кампутарныя праграмы — і самы распаўсюджаны спосаб гэтай ідэнтыфікацыі заключаецца ў распазнаванні скажоных знакаў. У рускай і беларускай мовах для такога тыпу заданняў няма адмысловага тэрміна, а ў ангельскай ён называецца Captcha — у гонар аднайменнага тэсту, у распрацоўцы якога ўдзельнічаў Луіс вон Ан.

Гэта працуе, таму што ў большасці людзей канстантнае ўспрыманне — яны могуць распазнаць літару А, незалежна ад таго, якім колерам яна будзе намаляваная, ці будзе тлустая або, напрыклад, напісаная курсівам. Кампутарныя праграмы сёння ў прынцыпе здольныя распазнаць скажоны знак, але даюць рады такому заданню нашмат менш эфектыўна.



У гэтым прыкладзе кампутар не змог распазнаць слова morning, таму сістэма прапануе яго карыстальніку. Каб паспяхова выканаць сваю асноўную функцыю — не дапусціць рэгістрацыі бота на сайце — reCaptcha прапануе яму іншае слова, якое кампутар распазнаць змог, а значыць, зможа ацаніць карэктнасць адказу, які ўводзіць карыстальнік.

На расшыфроўку Captcha траціцца ў сярэднім 10 секунд, і калі прыняць да ўвагі, што кожны дзень прыкладна 200 мільёнаў чалавек ва ўсім свеце ўводзяць Captcha хоць бы раз, то атрымліваецца, што кожны дзень губляецца 500 тыс. гадзін чалавечага часу.

Вон Ан прыдумаў, а Ticketmaster, Facebook, Twitter падхапілі ідэю сумясціць непазбежнае з карысным — калі ўжо вы расшыфроўваеце скажоныя сімвалы, то чаму вы павінныя расшыфроўваць абстрактныя, нікому не патрэбныя знакі? Замест гэтага вы можаце выдаткаваць 10 секунд, каб дапамагчы праграме распазнаць незразумелае слова з кнігі, якую трэба аблічбаваць для праекту Google Books, або старога выдання The New York Times.

Тут трэба заўважыць, што чым старэйшая кніга, тым больш у ёй словаў, якія выклікаюць цяжкасці ў праграмаў падчас аблічбоўкі — старонкі жоўкнуць, друк выліньвае; гэта прыводзіць да таго, што ў кнігах, старэйшых за 50 гадоў, прыкладна 30% словаў праграмы не могуць распазнаць. Менавіта гэтыя словы сёння прапануе распазнаць праграма reCaptcha, якую прыдумаў Вон Ан — і менавіта яе фішкі выкарыстоўваюцца на сайтах Ticketmaster, Facebook, Twitter, дзякуючы чаму распазнаецца прыкладна 100 млн словаў за дзень і 2,5 млн кніг за год.

Удзельнікаў праекту неймаверна шмат — прыкладна 750 млн чалавек, гэта значыць, прыкладна кожны дзясяты ў свеце, і гэтую аўдыторыю Вон Ан вырашыў выкарыстаць для вырашэння іншай, не менш важнай задачы падчас стварэння праекту Duolingo. Даследчык высветліў, што, з аднаго боку, інтэрнэт мае велізарны рэсурс, а з іншага — доступ да гэтага рэсурсу часцяком можа быць абцяжараны з прычыны моўнага бар'еру; мабыць ніхто не будзе спрачацца, што існаванне кожнага сайта на любой мове было б бясспрэчным дабром, аднак перакласці інтэрнэт-інфармацыю на ўсе магчымыя мовы досыць дорага — напрыклад, каб перакласці артыкулы адной толькі англамоўнай Вікіпедыі на гішпанскую, спатрэбіцца 50 млн даляраў і велізарная колькасць перакладчыкаў.

Каб пазбегнуць фінансавых выдаткаў, спатрэбіцца шмат людзей, што валодаюць дзвюма мовамі досыць добра, але ў той жа час не выкарыстоўваюць іх прафесійна — білінгваў, якіх зусім незразумела чым зацікавіць. Адзіная катэгорыя, зацікаўленая ў такой працы, —людзі, якія вучаць замежную мову і таму выконваюць такія заданні часта. Прапановы наконт таго, што трэба перакладаць, Вон Ан размясціў у парадку ўзрастання складанасці: пачаткоўцам прапануюцца самыя простыя сказы з падрадковым перакладам кожнага. Пераклад можна будзе зверыць з перакладам іншых і тым самым зрабіць працу над памылкамі.

Чым лепш вы будзеце перакладаць, тым больш складаныя прапановы прапануе вам Duolingo. Вынікі тэстаў паказалі, што пераклад прапановаў ад Duolingo прыносіць свае вынікі — і цалкам можа служыць яшчэ адным спосабам засваення замежнай мовы (эфектыўнасць была даказаная на матэрыяле праведзенага постфактум тэставання). Гэта, зрэшты, не здаецца такім ужо дзіўным: любы від сістэматычнай працы з замежнай мовай рана ці позна робіцца эфектыўным. Самым дзіўным у выпадку з гэтай праграмай стала хуткая і высокая, супастаўная з прафесійнай якасць перакладу.

Чытайце таксама

348