XML іздеу - Википедия - XML retrieval

XML іздеу, немесе XML ақпаратты іздеу, құрылымдалған құжаттарды мазмұнға негізделген алу болып табылады XML (кеңейтілетін белгілеу тілі). Осылайша ол есептеу үшін қолданылады өзектілігі XML құжаттарының жиынтығы.[1]

Сұрақтар

XML іздеу тәсілдерінің көпшілігі мұны ақпаратты іздеу (IR) ауданы, мысалы. кілт сөздерден (сұрау терминдерінен) тұратын құжат пен құжат арасындағы ұқсастықты есептеу арқылы. Алайда, XML-іздеу кезінде сұрау қамтуы мүмкін құрылымдық кеңестер. «Мазмұн және құрылым» (CAS) деп аталатын сұраныстар пайдаланушыларға сұралған мазмұнның қандай құрылымға ие болуы немесе болуы керектігін анықтауға мүмкіндік береді.

XML құрылымын пайдалану

Артықшылығын пайдалану өзін-өзі сипаттайтын XML құжаттарының құрылымы XML құжаттарын іздеуді айтарлықтай жақсарта алады. Бұған CAS сұрауларын қолдану, XML элементтерінің әр түрлі салмақталуы және субқұжаттардың бағытталған іздеуі кіреді.

Рейтинг

XML-Retrieval рейтингі мазмұнға сәйкестікті де, құрылымдық ұқсастықты да қамтуы мүмкін, бұл сұрауда берілген құрылым мен құжат құрылымы арасындағы ұқсастық. Сонымен қатар, XML сұранысынан туындаған іздеу бірліктері әрдайым толық құжаттар бола алмайды, бірақ кез-келген терең XML элементтері, яғни динамикалық құжаттар болуы мүмкін. Мақсаты - өте өзекті болып табылатын ең кіші іздеу бөлігін табу. Өзектілікті спецификация ұғымына сәйкес анықтауға болады, бұл іздеу бөлімшесінің сұраныс тақырыбына қаншалықты ден қоюы.[2]

Қолданыстағы XML іздеу жүйелері

Екі ықтимал тәсілге шолу қол жетімді.[3][4] XML-іздеуді бағалау бастамасы (INEX) 2002 жылы құрылған және оларды бағалауға арналған платформа ұсынады алгоритмдер.[2] XML-іздеуге үш түрлі бағыт әсер етеді:[5]

Дәстүрлі XML сұрау тілдері

Сұрау тілдері сияқты W3C стандартты XQuery[6] күрделі сұраныстарды жеткізіңіз, бірақ нақты сәйкестіктерді ғана іздеңіз. Сондықтан, оларды сәйкестігі бар есептеулермен көмескі іздеуге мүмкіндік беру үшін кеңейту керек. XML-бағытталған тәсілдердің көпшілігі құжаттар туралы нақты білімді білдіреді ' схемалар.[7]

Мәліметтер базасы

Классикалық дерекқор жүйелер сақтау мүмкіндігін қабылдады жартылай құрылымды мәліметтер[5] нәтижесінде дамыды XML дерекқорлары. Көбіне олар формальды, рейтингке қарағанда іздеуге көбірек көңіл бөледі және оларды күрделі сұраныстарды құрастыра алатын тәжірибелі қолданушылар пайдаланады.

Ақпаратты іздеу

Сияқты классикалық ақпаратты іздеу модельдері кеңістіктің векторлық моделі актуалды рейтингін ұсыну, бірақ құжат құрылымын қамтымау; тек жалпақ сұрауларға қолдау көрсетіледі. Сондай-ақ, олар статикалық құжат тұжырымдамасын қолданады, сондықтан іздеу бірліктері әдетте тұтас құжаттар болып табылады.[7] Оларды құрылымдық ақпаратты және динамикалық құжаттарды іздеуді қарастыру үшін кеңейтуге болады. Векторлық кеңістікті кеңейтуге арналған мысалдар бар: олар құжатты қолданады кіші ағаштар (индекс шарттары және құрылымы) векторлық кеңістіктің өлшемдері ретінде.[8]

Деректерге бағытталған XML деректер жиынтығы

Деректерге бағдарланған XML деректер жиынтығы үшін бірегей және ерекше іздеу әдісі, атап айтқанда, XDMA[9] XML дерекқорлары үшін екі жақты индекстеу және өзара қорытындылау негізінде жасалған және жасалған.

Сондай-ақ қараңыз

Әдебиеттер тізімі

  1. ^ Қыс, Джудит; Дробник, Освальд (9 қараша, 2007). «Тең-теңімен ортада XML ақпарат іздеу архитектурасы» (PDF). ACM. Алынған 2009-02-10.
  2. ^ а б Малик, Саадия; Тротман, Эндрю; Лалмас, Моуния; Фюр, Норберт (2007). «INEX 2006 шолу» (PDF). XML іздеуді бағалау бойынша бастаманың бесінші семинарының материалдары. Архивтелген түпнұсқа (PDF) 2008 жылғы 16 қазанда. Алынған 2009-02-10.
  3. ^ Амер-Яхия, Сихем; Лалмас, Моуния (2006). «XML іздеу: тілдер, INEX және ұпайлар» (PDF). SIGMOD Rec. 35 (4). дои:10.1145/1228268.1228271. S2CID  17300151. Алынған 2009-02-10.[өлі сілтеме ]
  4. ^ Пал, Сукомал (30.06.2006). «XML іздеу: сауалнама». Техникалық есеп, CVPR. CiteSeerX  10.1.1.109.5986. Журналға сілтеме жасау қажет | журнал = (Көмектесіңдер)
  5. ^ а б Фюр, Норберт; Геверт, Н .; Казай, Габриелла; Лалмас, Моуния (2003). «INEX: XML іздеуді бағалау бастамасы» (PDF). Бірінші INEX семинарының материалдары, Дагстюль, Германия, 2002 ж. ERCIM семинар-практикумы, Франция. Архивтелген түпнұсқа (PDF) 2008 жылдың 21 қарашасында. Алынған 2009-02-10.
  6. ^ Боаг, Скотт; Чемберлин, Дон; Фернандес, Мэри Ф .; Флореску, Даниэла; Роби, Джонатан; Симеон, Жером (23 қаңтар 2007). «XQuery 1.0: сұраныстың XML тілі». W3C ұсынысы. Дүниежүзілік желі консорциумы. Алынған 2009-02-10.
  7. ^ а б Шлядер, Торстен; Меусс, Холгер (2002). «XML құжаттарын сұрау және дәрежелеу». Американдық ақпараттық ғылымдар және технологиялар қоғамының журналы. 53 (6): 489–503. дои:10.1002 / asi.10060. Архивтелген түпнұсқа 2007 жылы 10 маусымда. Алынған 2009-02-10.
  8. ^ Лю, Шаорун; Цзоу, Цинхуа; Чу, Уэсли В. (2004). «XML ақпаратты іздеу үшін теңшелетін индекстеу және рейтинг» (PDF). SIGIR'04. ACM. Алынған 2009-02-10.
  9. ^ Селваганесан, С .; Хау, Су-Чен; Көп ұзамай, Lay-Ki (2014). «XDMA: қосарлы индекстеу және өзара жиынтыққа негізделген кілт сөздерді іздеу алгоритмі XML үшін». Бағдарламалық жасақтама және білім инженериясының халықаралық журналы. 24 (4): 591–615. дои:10.1142 / s0218194014500223.