ЕВ1: Относно превода на Information Retrieval
В българския език няма няма общоприет преводен еквивалент на това понятие. Някои автори изпозлват термина "Обработка на Информация", други - "Извличане на Информация", а трети - не го превеждат (както правя и аз до момента).
Но:
"Обработка на Информация" = "Information Processing"
"Извличане на Информация" = "Information Extraction" ,
Тогава ? Може би "Обработка и Извличане на Информация" или още по-точно (но по-сложно): "Обработка на Документи и Извличане на Информация"
или (най-простото, но имащо връзка с приложението) "Търсене на Информация" ?
Но:
"Обработка на Информация" = "Information Processing"
"Извличане на Информация" = "Information Extraction" ,
Тогава ? Може би "Обработка и Извличане на Информация" или още по-точно (но по-сложно): "Обработка на Документи и Извличане на Информация"
или (най-простото, но имащо връзка с приложението) "Търсене на Информация" ?
Обаче: първа е обработката (на документите, не на информацията), после е търсенето, извежднето - на края. И ако получените/изведените резултати може да считаме за информация, то въпроса за това как потребителя ще си обработва получената информация не касае IR системата.
Retrieval-a е по-скоро обобщаващ термин (естествено, в контекста на дисциплината IR) за всички онези действия (анализиране, индексиране, търсене, ranking, ...), които е необходимо да се извършат за да се открие информация в голям масив от документи, в съответсвие с предварително заденени критерии (потребителска заявка).
Всъщност, обработката е навсякъде: обработваме документите, търсим в тях, обработваме резултатие, ...
Защо ли съм интерпретирала 'извеждане' само и единствено като "показване на екрана" (сигурно, защото в един куп бг текстове се говори за "извеждане на информация на/върху екрана") - та съм написала тази глупост:
" ...после е търсенето, извежднето - на края"
Естествено, ако се използва 'извеждане' като синоним за 'осъществяване на логически извод', 'извеждам'='заключавам' (правя заключение), то си абослютно права, т.е. звучи подходящо да се говори за "Извеждане на Информация", но тук вече проблема ще е полисемията...
Ох, как може, например в химията, биологията, да си ползват официално транскрибирани термини, и тези термини, макар и неизползвани от обикновените хора да влизат в речниците, а едно такова актуално понятие като "retrieval" (в контекста на "Information Retrieval") да не е лексикализирано на български (да не говорим за "Data Mining"). Всъщност, и на мен не ми звучи добре "Ретрийвинг на информация" (а това вече е върха: "Информационен Ретрийвинг"), но и ми омръзна да пиша "Infomation Retrieval". Може би ако използвам това:
"retrieval - n. ....; act of finding information and sending it to the user as output (Computers) ",
ще мога да обоснова изпозването на "Намиране на Информация" ... (?)
Всъщност, това последното до момента ми звучи най-добре, най-точно... но дали няма да звучи прекалено 'постно' за една дисертация
Ще възвъобразявам сънища...
П.С. Работата касае 'обратното' на Сементичната Мрежа като възможност за решаване на проблема с информационното претоварване (виж. Т.Б. Лии, линк - по-късно, че сега не ми се рови)
Ръководител имам,но той не се ангажира с такива въпроси, всъщност това тук го постнах просто така, за себе си, но и надявайки се някой необвързан с тези неща да изкаже мнение. А то какво се случи...
Лека нощ на мен и добър да е денят за всички, които възнамеряват да го оползотворят....
Този поток на мисълта (чието изображение ми напомня LISP) нещо ми убягва в средата, може би ако дефинрираш Be(Noun) && Be(Short) ... (иначе е ясно, че ще рече "да е съществително в кратка форма", губи ми се формалната страна)
RetroEvaluation
Retrieval
Грубо и неформализирано за машина, напр.: по-добре за примера от Evaluate е Evaluation. "Кратко" - крайната дума да е с брой знаци <= 60% от сборния брой на двете думи. Да се спазват словообразувателни правила от англ.
надявайки се някой необвързан с тези неща да изкаже мнение. А то какво се случи...
Това упрек ли е? :)
Очаквам отговора за обратното на сем.мрежа! ( Централизирана семантика? )
Това упрек ли е? :)"
Интуицията ми нашепва, че ти много добре си усетил че не е упрек и се чудя защо си решил да попиташ? Но ако трябва да отговоря - естествено, че не е упрек, a ОБРАТНОТО на упрек ...(моля те, не питай какво е 'обратното' на упрек ....)
тук ме озадачи факта, че използваш атоми от вида: p(X) , които могат да се изтълкуват като предикати или (ЛИСП) функции, но в същия момент изпозлваш и атоми/константи от вида "А", "Б" и точно това ме озадачи. Т.е. този поток на мисълта на концептуално ниво ми бе ясен (и много ми хареса), но нещо на синтактично ниво ме обърка ...
Както и да е.
П.С. може би ако беше изпозлвал, например:
Conc("Retro","Evaluate" ) - щеше да ми изглежда по-точно
T.e. - горката ти мислеща машина: ще трябва един път да тълкува && като логическа операция и един път като "съедини" (за такава свободна интерпретация сигурно и Лари Уол не е сънувал)
Определено, описнието дадено в сайта съответства на това за "Data Mining" или още по-точно на : "Intelligent Data Mining" . Всъщност, не съм сигурна дали такава дисциплина е разпространена - DataMining-a ми е скучен и не се занимавам с него, но няма начин да няма, то вече пред какво ли не се слага прилагателното "Intelligent".
Дори се учудвам, защо не са кръстили BGLog.net например: Intelligent Blog Space или нещо подобно - с това непредвидимо поведение, мисля сайта смело може да претендира за "интелигентност"
Ако не е "retro", а примерно "retry" -> в смисъл "повторно", става нещо като "възстановяване на (смисъла на) информацията", отново, след като някога преди това е записана, запомнена или каквото е направена.
Попрочетох малко из google /и други IR системи :)/ и доколкото разбрах за какво става дума - "извличане на информация" ми се струва доста точно. Какво значение има дали "извличане" е "extraction", ако отговаря на вложения смисъл? Кой смисъл се влага обаче, е най-добре да прецени самият, ползващ израза..
Още един превод ми изглежда подходящ - простичкото "намиране на информация". Имам предвид, че етимологията на "retrieve" /пак според нета, не знам френски.. ;(/ е от старофренски и едно от значенията е "намирам". Вече след това, както пише Tosh, може да се уточни в няколко реда какво точно се има предвид.
Един необвързан коментар..
Впрочем и аз в началото използвах "Извличане на Информация" и възприемах като естествено "Възвръщане на Информация" (още повече че това е буквалния превод на retrieval).
Но разликата, с две думи, между IR и IE:
IR системата връща като резултат (препратки към/адреси на)ДОКУМЕНТИ (/Уеб страници).
IE системата връща ФАКТИ, ЗНАИЯ, изобщо -ИНФОРМАЦИЯ, която се съдържа в документите, при това във формат удобен за обработка със СУБД.
Един вид, IE системата трябва да "смели" информацията вместо потребителя. Е, това "мелене" естествено е по-скоро на нивото на Data Mining-a ...а пък разликата между IE и DM е че при IE предварително се задава какво се търси.
(но както споменах -хич ме няма в последните две области)
Но съм адски щастлива, че никой не спомена за "Информационен Ретрийвинг"
Тогава прекалено смело ли ще е предложение от сорта на "намиране/извличане на документи"? Или ако не са документи, то съответните други носители на информацията /уеб страници, записи в БД,.../? Или много принизявам нещата?.. :)
Ето пример: "Бог".
Ааааа... "trouver" (намирам) и "retrouver" (н. отново)... И evaluer.
...
За дали е упрек: имах известни колебания от тона, но усмивката показва, и че питах и на шега.
За:
"(("Retro" && "Evaluate" ) && Be(Noun) && Be(Short) ) => Retrieval
тук ме озадачи факта, че използваш атоми от вида: p(X) , които могат да се изтълкуват като предикати или (ЛИСП) функции, но в същия момент изпозлваш и атоми/константи от вида "А", "Б" и точно това ме озадачи.
Conc("Retro","Evaluate" ) - щеше да ми изглежда по-точно
T.e. - горката ти мислеща машина: ще трябва един път да тълкува && като логическа операция и един път като "съедини" (за такава свободна интерпретация сигурно и Лари Уол не е сънувал)"
:)
Както вече казах, това не е код за "кодомелачка", а по-скоро мисли на мислеща машина, описани дотолкова че да бъдат разбрани от други мислещи машини ( хора ). И не е слепване на низове, а "съставяне на дума".
По-скоро:
Language.Creation.CreateNewWordFromWords("Retro", "Evaluation", BE_SHORT, BE_NOUN );
//естествено, че не е додефинирана напълно, това е псевдокод
"т.е. 'обратното' трябва да е "the artificial intelligence problem of training machines to behave like people" (макар че аз лично твърдя че двата подхода трябва да се обединят, в контекста на WWW рабира се)"
Представата ми сега, е че работата ти ще е нещо за семантичен уеб, който обаче е семантичен не толкова заради парадигмата с онтологии и XML, а защото търсещите машини ще четат и разсъждават върху обикновеното хтмл съдържание, както би правил човек?
Правилно ли е предположение, че работата ти ще е повече върху действието на умната система, отколкото върху структурата на семантичния уеб?
Любопитен съм за подробности, когато са достъпни.
Сетих се за една случка от "Малкия принц":
Това по отношение на практиката в последно време.. :)
И впрочем, термина 'онтологии' малко дразнещо за мен се обсеби от WWW и the Semantic Web (добре, че не съм философ, защото това 'малко' нямаше да е такова).
Да, видях препинателния знак ':)' в края и схванах шегата, ...и това ме накара да приискам и аз да се пошегувам
:)
>Да Тош, но за съжаление не мога да си позволя да използвам понятието "умна система", тъй като СНС ще ме изрита (пък и колегите в университета не биха се прехласнали пред това) Така че - да, за "Интелектни търсещи системи" иде реч."
Ахм... :) Интелектни?
// виж левия панел, Потребителско меню, Нови Писма