Кампутар адказвае хто важнейшы — Дыкенс ці Остэн
30 студзеня 2013
Колькі кніг трэба прааналізаваць даследчыку, каб прыйсці да нейкай больш-менш аўтарытэтнай высновы наконт уплывовасці ў літаратуры — 50, 100, 200? У любым выпадку, гэта праца на доўгія гады, калі не на дзесяцігоддзі.
А вось кампутары, калі іх загрузіць адпаведнай праграмай статыстычнага аналізу словаў, могуць прааналізаваць значна больш кніг і значна хутчэй, чым чалавек.
Мэцью Джокерс, літаратуразнаўца з Універсітэта штата Небраска, выкарыстаў кампутары для статыстычнага аналізу стылю і тэмаў у амаль 3600 кнігах, выдадзеных у 1780—1900 гг.
Вынік, атрыманы прафесарам Джокерсам, быў даволі нечаканы. Аказваецца, не Чарлз Дыкенс, не Томас Гардзі і не Герман Мэлвіл з Маркам Твэнам былі найважнейшымі ангельскамоўнымі пісьменнікамі для сваіх калегаў-сучаснікаў.
Паводле кампутарнага аналізу Мэцью Джокерса, найбольш уплывовымі ангельскамоўнымі пісьменнікамі ХІХ стагоддзя былі Джэйн Остэн (аўтарка, сярод іншага, “Пыхі і перадузятасці”) і Вальтэр Скот (аўтар гістарычных раманаў, напрыклад “Айвэнга”).
“Традыцыйна гісторыю літаратуры пісалі на аснове вывучэння адносна невялікай колькасці тэкстаў. Гэтая тэхналогія дазваляе вам убачыць вялікую карціну — кантэкст, у якім працаваў пісьменнік, — у маштабе, які не быў даступны раней”, — сказаў Джокерс пра свой дослед выданню New York Times.
Джокерс, які вывучаў ангельскую філалогію ва ўніверсітэце, самастойна навучыўся праграмаванню і статыстычным метадам аналізу. Матэматычныя мадэлі, якія ён выкарыстоўвае ў аналізе сувязяў паміж літаратурнымі тэкстамі, шмат у чым нагадваюць алгарытмы, якія ўжываюцца пошукавай сістэмай Google.
Статыстычныя метады аналізу ў гуманітарных і грамадскіх навуках пры выкарыстанні вялікай колькасці дадзеных і з дапамогай кампутараў усё пашыраюцца, спараджаючы новую тэрміналогію. Такім чынам, колькасны аналіз у паліталогіі сёння называецца палітычнай метадалогіяй, у гісторыі — кліяметрыяй, у літаратуры — стыляметрыяй. Агулам колькасны аналіз у гуманітарных і грамадскіх навуках называецца культуромікай.
Адна з самых прыдатных крыніц тэкстаў для статыстычных доследаў — віртуальнае сховішча кніг Google Books, у якім можна правесці кампутарны пошук сярод 20 мільёнаў адсканаваных кніг.
У 2011 годзе група даследчыкаў з Гарвардскага ўніверсітэта з дапамогай пошуку ў Google Books правяла даследаванне на тэму, як хутка забываецца мінулае, заключанае ў кнігах. Даследчыкі аналізавалі адсылкі да канкрэтных гадоў у кнігах, што захоўваюцца ў Google Books. Для прыкладу, колькасць адсылак на “1880”, пік якіх прыпаў якраз на гэты год, паменшала ўдвая ў 1912 годзе, гэта значыць, праз 32 гады. А вось колькасць спасылак на “1973” паменшала ўдвая ўжо ў 1983 годзе, гэта значыць, праз 10 гадоў. “Мы забываем мінулае з кожным наступным годам усё хутчэй”, — напісалі даследчыкі ў высновах да сваёй працы.