BgLOG.net 01.10.2006 potrebitel 989 прочитания

ЕВ1: Относно превода на Information Retrieval

В българския език няма няма общоприет преводен еквивалент на това понятие. Някои автори изпозлват термина "Обработка на Информация", други - "Извличане на Информация", а трети - не го превеждат (както правя и аз до момента).

Но:
"Обработка на Информация" = "Information Processing"
"Извличане на Информация" = "Information Extraction" ,

Тогава ? Може би "Обработка и Извличане на Информация" или още по-точно (но по-сложно): "Обработка на Документи и Извличане на Информация"
или (най-простото, но имащо връзка с приложението) "Търсене на Информация" ?

Тагове

езикови въпроси (1)

Коментари

borislava преди 19 години и 7 месеца

"Обработката" е нещо, което евентуално ще се случи след retrieval-а, "търсенето" го предхожда, а пък "извличане" предполага действие с част от някакво цяло. Според мене подходящо е "извеждане".

potrebitel преди 19 години и 7 месеца

:) Виждаш ли - всички пишем retrievl-a, recall-a и пр. Ужасно.

Обаче: първа е обработката (на документите, не на информацията), после е търсенето, извежднето - на края. И ако получените/изведените резултати може да считаме за информация, то въпроса за това как потребителя ще си обработва получената информация не касае IR системата.

Retrieval-a е по-скоро обобщаващ термин (естествено, в контекста на дисциплината IR) за всички онези действия (анализиране, индексиране, търсене, ranking, ...), които е необходимо да се извършат за да се открие информация в голям масив от документи, в съответсвие с предварително заденени критерии (потребителска заявка).

Всъщност, обработката е навсякъде: обработваме документите, търсим в тях, обработваме резултатие, ...

borislava преди 19 години и 7 месеца

Ааа - ти имаш предвид обработка от системата, а не от потребителя. Тогава редът наистина се променя. А пък щом става дума за селектиране по дадени критерии на определена част от масива, извличане е ок. Обаче покриването с extraction не се избягва така...

potrebitel преди 19 години и 7 месеца

"Според мене подходящо е "извеждане". )

Защо ли съм интерпретирала 'извеждане' само и единствено като "показване на екрана" (сигурно, защото в един куп бг текстове се говори за "извеждане на информация на/върху екрана") - та съм написала тази глупост:
" ...после е търсенето, извежднето - на края"

Естествено, ако се използва 'извеждане' като синоним за 'осъществяване на логически извод', 'извеждам'='заключавам' (правя заключение), то си абослютно права, т.е. звучи подходящо да се говори за "Извеждане на Информация", но тук вече проблема ще е полисемията...

Ох, как може, например в химията, биологията, да си ползват официално транскрибирани термини, и тези термини, макар и неизползвани от обикновените хора да влизат в речниците, а едно такова актуално понятие като "retrieval" (в контекста на "Information Retrieval") да не е лексикализирано на български (да не говорим за "Data Mining"). Всъщност, и на мен не ми звучи добре "Ретрийвинг на информация" (а това вече е върха: "Информационен Ретрийвинг"), но и ми омръзна да пиша "Infomation Retrieval". Може би ако използвам това:

"retrieval - n. ....; act of finding information and sending it to the user as output (Computers) ",

ще мога да обоснова изпозването на "Намиране на Информация" ... (?)

Всъщност, това последното до момента ми звучи най-добре, най-точно... но дали няма да звучи прекалено 'постно' за една дисертация

potrebitel преди 19 години и 7 месеца

Ще отговоря, непременно ще ти отговоря (макар че след коментар като твоя всеки друг би изглеждал блед )...само че не сега - прекалено е интересно, важно ... и непосилно за човек, който тъкмо мисли да ляга.
Ще възвъобразявам сънища...

П.С. Работата касае 'обратното' на Сементичната Мрежа като възможност за решаване на проблема с информационното претоварване (виж. Т.Б. Лии, линк - по-късно, че сега не ми се рови)

Ръководител имам,но той не се ангажира с такива въпроси, всъщност това тук го постнах просто така, за себе си, но и надявайки се някой необвързан с тези неща да изкаже мнение. А то какво се случи...

Лека нощ на мен и добър да е денят за всички, които възнамеряват да го оползотворят....

potrebitel преди 19 години и 7 месеца

Този поток на мисълта (чието изображение ми напомня LISP) нещо ми убягва в средата, може би ако дефинрираш Be(Noun) && Be(Short) ... (иначе е ясно, че ще рече "да е съществително в кратка форма", губи ми се формалната страна)

Tosh преди 19 години и 7 месеца

Не e формализирация, която да се пусне на ЛИСП и да работи, това е "формализация за мислеща машина", тя трябва да си донагажда подробностите...

RetroEvaluation
Retrieval

Грубо и неформализирано за машина, напр.: по-добре за примера от Evaluate е Evaluation. "Кратко" - крайната дума да е с брой знаци <= 60% от сборния брой на двете думи. Да се спазват словообразувателни правила от англ.

надявайки се някой необвързан с тези неща да изкаже мнение. А то какво се случи...

Това упрек ли е? :)

Очаквам отговора за обратното на сем.мрежа! ( Централизирана семантика? )

potrebitel преди 19 години и 7 месеца

"надявайки се някой необвързан с тези неща да изкаже мнение. А то какво се случи...

Това упрек ли е? :)"

Интуицията ми нашепва, че ти много добре си усетил че не е упрек и се чудя защо си решил да попиташ? Но ако трябва да отговоря - естествено, че не е упрек, a ОБРАТНОТО на упрек ...(моля те, не питай какво е 'обратното' на упрек ....)

potrebitel преди 19 години и 7 месеца

" (("Retro" && "Evaluate" ) && Be(Noun) && Be(Short) ) => Retrieval "

тук ме озадачи факта, че използваш атоми от вида: p(X) , които могат да се изтълкуват като предикати или (ЛИСП) функции, но в същия момент изпозлваш и атоми/константи от вида "А", "Б" и точно това ме озадачи. Т.е. този поток на мисълта на концептуално ниво ми бе ясен (и много ми хареса), но нещо на синтактично ниво ме обърка ...
Както и да е.

П.С. може би ако беше изпозлвал, например:

Conc("Retro","Evaluate" ) - щеше да ми изглежда по-точно
T.e. - горката ти мислеща машина: ще трябва един път да тълкува && като логическа операция и един път като "съедини" (за такава свободна интерпретация сигурно и Лари Уол не е сънувал)

potrebitel преди 19 години и 7 месеца

"В пловдивския ФМИ името на науката се превежда в една избираема като "Интелигентна обработка на данни", води я господин от БАН. http://www.fmi-plovdiv.org/bg_ver/edu/izb_a/130.htm Или по-скоро наричат "Data Mining"-а с това име. "

Определено, описнието дадено в сайта съответства на това за "Data Mining" или още по-точно на : "Intelligent Data Mining" . Всъщност, не съм сигурна дали такава дисциплина е разпространена - DataMining-a ми е скучен и не се занимавам с него, но няма начин да няма, то вече пред какво ли не се слага прилагателното "Intelligent".
Дори се учудвам, защо не са кръстили BGLog.net например: Intelligent Blog Space или нещо подобно - с това непредвидимо поведение, мисля сайта смело може да претендира за "интелигентност"

afterd преди 19 години и 7 месеца

Без претенции да съм на висотата на предните постващи :) и тръгвайки от retro и evaluation, се замислих...

Ако не е "retro", а примерно "retry" -> в смисъл "повторно", става нещо като "възстановяване на (смисъла на) информацията", отново, след като някога преди това е записана, запомнена или каквото е направена.

Попрочетох малко из google /и други IR системи :)/ и доколкото разбрах за какво става дума - "извличане на информация" ми се струва доста точно. Какво значение има дали "извличане" е "extraction", ако отговаря на вложения смисъл? Кой смисъл се влага обаче, е най-добре да прецени самият, ползващ израза..

Още един превод ми изглежда подходящ - простичкото "намиране на информация". Имам предвид, че етимологията на "retrieve" /пак според нета, не знам френски.. ;(/ е от старофренски и едно от значенията е "намирам". Вече след това, както пише Tosh, може да се уточни в няколко реда какво точно се има предвид.

Един необвързан коментар..

potrebitel преди 19 години и 7 месеца

..за който благодаря.

Впрочем и аз в началото използвах "Извличане на Информация" и възприемах като естествено "Възвръщане на Информация" (още повече че това е буквалния превод на retrieval).

Но разликата, с две думи, между IR и IE:
IR системата връща като резултат (препратки към/адреси на)ДОКУМЕНТИ (/Уеб страници).
IE системата връща ФАКТИ, ЗНАИЯ, изобщо -ИНФОРМАЦИЯ, която се съдържа в документите, при това във формат удобен за обработка със СУБД.
Един вид, IE системата трябва да "смели" информацията вместо потребителя. Е, това "мелене" естествено е по-скоро на нивото на Data Mining-a ...а пък разликата между IE и DM е че при IE предварително се задава какво се търси.

(но както споменах -хич ме няма в последните две области)

Но съм адски щастлива, че никой не спомена за "Информационен Ретрийвинг"

afterd преди 19 години и 7 месеца

Мисля, че разбрах.. Благодаря за обяснението.

Тогава прекалено смело ли ще е предложение от сорта на "намиране/извличане на документи"? Или ако не са документи, то съответните други носители на информацията /уеб страници, записи в БД,.../? Или много принизявам нещата?.. :)

potrebitel преди 19 години и 7 месеца

Лично на мен "Намиране на документи" ми звучи най-правилно, макар и звучащо (не успях да измисля синоним) "просто", "принизено" . Всъщност, едно просто наименоване обозначава (лексикализира, хм тук синоними - бол) най-добре сложните понятия (каквито са научните дисциплини).
Ето пример: "Бог".

А и практиката в последно време, май доказва антипода на горната теза (прости неща се "кичат" със сложни наименования). Може би, в този ред на мисли, ще трябва да анализирам често-обземащите ме желания да куртоазнича ;)

Tosh преди 19 години и 7 месеца

"Имам предвид, че етимологията на "retrieve" /пак според нета, не знам френски.. ;(/ е от старофренски и едно от значенията е "намирам"."

Ааааа... "trouver" (намирам) и "retrouver" (н. отново)... И evaluer.

...

За дали е упрек: имах известни колебания от тона, но усмивката показва, и че питах и на шега.

За:

"(("Retro" && "Evaluate" ) && Be(Noun) && Be(Short) ) => Retrieval
тук ме озадачи факта, че използваш атоми от вида: p(X) , които могат да се изтълкуват като предикати или (ЛИСП) функции, но в същия момент изпозлваш и атоми/константи от вида "А", "Б" и точно това ме озадачи.

Conc("Retro","Evaluate" ) - щеше да ми изглежда по-точно
T.e. - горката ти мислеща машина: ще трябва един път да тълкува && като логическа операция и един път като "съедини" (за такава свободна интерпретация сигурно и Лари Уол не е сънувал)"

:)

Както вече казах, това не е код за "кодомелачка", а по-скоро мисли на мислеща машина, описани дотолкова че да бъдат разбрани от други мислещи машини ( хора ). И не е слепване на низове, а "съставяне на дума".

По-скоро:

Language.Creation.CreateNewWordFromWords("Retro", "Evaluation", BE_SHORT, BE_NOUN );

//естествено, че не е додефинирана напълно, това е псевдокод

"т.е. 'обратното' трябва да е "the artificial intelligence problem of training machines to behave like people" (макар че аз лично твърдя че двата подхода трябва да се обединят, в контекста на WWW рабира се)"

Представата ми сега, е че работата ти ще е нещо за семантичен уеб, който обаче е семантичен не толкова заради парадигмата с онтологии и XML, а защото търсещите машини ще четат и разсъждават върху обикновеното хтмл съдържание, както би правил човек?

Правилно ли е предположение, че работата ти ще е повече върху действието на умната система, отколкото върху структурата на семантичния уеб?

Любопитен съм за подробности, когато са достъпни.

afterd преди 19 години и 7 месеца

Радвам се, че ти допада предложението. Не казвам "моето", понеже съм почти сигурен, че си ти е хрумвало и преди :)

Сетих се за една случка от "Малкия принц":

"Този астероид бе забелязан с телескоп само веднъж през 1909 година, от един турски астроном.

Тогава той съобщи и доказа откритието си на Международен астрономически конгрес. Но никой не му повярва заради облеклото. Възрастните са такива.

Астероид Б 612 запази честта си благодарение на един турски диктатор, който наложи на народа си да се облича по европейски под страх от смъртно наказание. Астрономът повтори доказателството си през 1920 година, облечен в много елегантен фрак. Този път всички бяха на неговото мнение."

Това по отношение на практиката в последно време.. :)

potrebitel преди 19 години и 7 месеца

Да Тош, но за съжаление не мога да си позволя да използвам понятието "умна система", тъй като СНС ще ме изрита (пък и колегите в университета не биха се прехласнали пред това) Така че - да, за "Интелектни търсещи системи" иде реч.

И впрочем, термина 'онтологии' малко дразнещо за мен се обсеби от WWW и the Semantic Web (добре, че не съм философ, защото това 'малко' нямаше да е такова).

potrebitel преди 19 години и 7 месеца

"За дали е упрек: имах известни колебания от тона, но усмивката показва, и че питах и на шега. "

Да, видях препинателния знак ':)' в края и схванах шегата, ...и това ме накара да приискам и аз да се пошегувам

Tosh преди 19 години и 7 месеца

> и това ме накара да приискам и аз да се пошегувам

:)

>Да Тош, но за съжаление не мога да си позволя да използвам понятието "умна система", тъй като СНС ще ме изрита (пък и колегите в университета не биха се прехласнали пред това) Така че - да, за "Интелектни търсещи системи" иде реч."

Ахм... :) Интелектни?

// виж левия панел, Потребителско меню, Нови Писма

Tosh преди 19 години и 7 месеца