Мәтінді шегелеу - Text nailing

Жетекшілік ететін оқыту мәтіндік тырнаққа қарсы
Тек қана алфавит бойынша түрлендірілген жазбаның мысалы («шегеленген нота»)

Мәтіндік тырнақ (TN) - бұл ақпаратты шығару құрылымданбаған құжаттардан құрылымдық ақпаратты жартылай автоматты түрде шығару әдісі. Әдіс адамға құжаттардың үлкен жинағындағы шағын мәтіндік блоктарды интерактивті түрде қарастыруға, ықтимал ақпараттық өрнектерді анықтауға мүмкіндік береді. Анықталған өрнектерді мәтінге негізделген есептеу әдістерін жақсарту үшін пайдалануға болады (мысалы, Тұрақты өрнек ) сонымен қатар озық табиғи тілді өңдеу (NLP) техникасы. TN екі ұғымды біріктіреді: 1) әңгімелеу мәтінімен адамның өзара әрекеттесуі, өте кең таралған жоққа шығарылмаған өрнектерді анықтау және 2) барлық өрнектер мен жазбаларды тек бірыңғай көріністер жасау үшін тек алфавиттік емес көріністерге айналдыру. [1][2]

Дәстүрлі түрде машиналық оқыту тәсілдері мәтінді жіктеу, адамның сарапшысынан сөз тіркестерін немесе тұтас жазбаларды белгілеу қажет, содан кейін а бақыланатын оқыту алгоритм ассоциацияларды жалпылауға және оларды жаңа мәліметтерге қолдануға тырысады. Керісінше, жоққа шығарылмаған нақты өрнектерді қолдану жалпылауға қол жеткізу үшін қосымша есептеу әдісін қажет етпейді.[3][4][5]

Тарих

TN әзірленді Массачусетс жалпы ауруханасы және көптеген сценарийлер бойынша сыналды, оның ішінде темекі шегу мәртебесін шығару, коронарлық артерия ауруының отбасылық тарихы, ұйқысы бұзылған науқастарды анықтау,[6] дәлдігін жақсарту Фреймингем тәуекел баллы бар науқастарға арналған алкогольсіз бауыр майлы ауруы, және 2 типті қант диабетімен келіспеуді жіктеңіз. Ішіндегі мәтіндік құжаттардан ақпарат алуға қатысты жан-жақты шолу электронды денсаулық жазбасы қол жетімді.[7][8]

Мәтінге негізделген жіктеуіштердің жоғарылау дәлдігіне қол жеткізу үшін жоққа шығарылмаған өрнектерді пайдаланудың маңыздылығы 2018 жылдың қазан айында ACM Communications-те жарияланған хатта баса айтылды.[9]

Бастапқы код

«Шегеулі өрнектерді» қолданып, баяндау ноталарынан темекі шегу мәртебесін алуға арналған үлгі код бар GitHub.[10]

Прогрессивті кибер-адами интеллект ретінде TN

2018 жылдың шілде айында зерттеушілер Virginia Tech және Урбанадағы Иллинойс университеті - Шампейн прогрессивті кибер-адами интеллектке (PCHI) мысал ретінде TN деп атады.[11]

Денсаулық сақтауда машиналық оқытудың сыны

Chen & Asch 2017 «Машиналық оқыту үдемелі үміттердің шыңында тұрған кезде, біз технологияның мүмкіндіктері мен шектеулерін жоғарырақ бағалауға ықпал ету арқылы келесі апатты« түңілу шұңқырына »жұмсарта аламыз» деп жазды.[12]

Жылы жарияланған хат ACM байланысы, «Дөрекі күштен тыс», өрескел күштің әдісі мәтінге қолданған кезде дәстүрлі машиналық оқыту алгоритміне қарағанда жақсы нәтиже бере алатындығын баса айтты. Хатта «... машиналық оқыту алгоритмдері мәтінге қатысты кез-келген тілде мүмкін болатын сөз тіркестерінің шексіз санын қамтиды деген болжамға сүйенеді. Керісінше, әртүрлі медициналық жағдайларға байланысты, біз клиниктердің дәл осылай қолданатындығын байқадық пациенттердің жағдайын сипаттайтын өрнектер ».[13]

Мәтіндік Nailing-тің бірлескен авторы Ури Картун медицинадағы деректерді баяу қабылдау туралы 2018 жылдың маусымында жарияланған өзінің көзқарасы бойынша «... Text Nailing медициналық информатика журналдарының рецензенттерінде күмән туғызды, олар қарапайымға тәуелді деп мәлімдеді. мәтінді жеңілдетуге арналған трюктер және адамның аннотациясына сүйенеді.TN шынымен де бірінші көзқараста жарықтың қулығы сияқты көрінуі мүмкін, бірақ бұл шын мәнінде әлдеқайда күрделі әдіс, бұл шынымен де авантюралық шолушылар мен редакторлардың назарын өзіне аударды. оны жариялау үшін ».[14]

Сын

Адамның циклдік процесі - бұл домендік сарапшылардың көмегімен функцияларды жасау тәсілі. Мүмкіндіктерді ұсыну үшін домендік сарапшыларды пайдалану жаңа түсінік емес. Домен сарапшыларына мүмкіндіктерді құруға көмектесетін нақты интерфейстер мен әдіс, мүмкін, жаңа болып табылады.

Бұл жағдайда мамандар жасайтын ерекшеліктер тұрақты тіркестерге тең келеді. Алфавиттік емес таңбаларды алып тастау және «smokesppd» бойынша сәйкестендіру тұрақты сөз / smokes [^ a-zA-Z] * ppd / -ге тең. Мәтінді жіктеудің ерекшеліктері ретінде тұрақты тіркестерді қолдану жаңалық емес.

Осы ерекшеліктерді ескере отырып, жіктеуіш - бұл құжаттар жиынтығында орындалуымен шешілетін авторлардың қолмен орнатылған шегі. Бұл жіктеуіш, тек жіктеуіштің параметрлері, бұл жағдайда шекті мән қолмен орнатылады. Бірдей ерекшеліктер мен құжаттарды ескере отырып, машиналық оқытудың кез-келген алгоритмі бірдей шекті немесе (мүмкін) жақсырақ таба алуы керек.

Авторлар тірек векторлық машиналарды (SVM) және жүздеген құжаттарды қолдану нашар өнімділік беретіндігін атап өтті, бірақ SVM қандай ерекшеліктер мен құжаттарда оқытылған / тексерілгенін көрсетпейді. Әділ салыстыру кезінде шекті қолмен жіктеуіш қолданатындай мүмкіндіктер мен құжаттар жиынтығы қолданылуы мүмкін.

Әдебиеттер тізімі

  1. ^ Картун, Ури (2017). «Мәтінді шегелеу». Өзара әрекеттесу. 24 (6): 44–9. дои:10.1145/3139488. S2CID  29010232.
  2. ^ Барбоса, Симоне; Коктон, Гилберт (2017). «Дизайнды ойластыра отырып, күн тәртібінен аулақ болу». Өзара әрекеттесу. 24 (6): 5. дои:10.1145/3151556. S2CID  657561.
  3. ^ Бим, Эндрю Л; Картун, Ури; Пай, Дженнифер К; Чатерджи, Арнауб К; Фицджеральд, Тимоти Р; Шоу, Стэнли Ю; Kohane, Isaac S (2017). «Ұйқының дәрілік рецепттері мен клиникалық шешім қабылдауға әсер ететін дәрігер-пациенттің динамикасын болжамды модельдеу». Ғылыми баяндамалар. 7: 42282. Бибкод:2017 Натрия ... 742282B. дои:10.1038 / srep42282. PMC  5299453. PMID  28181568.
  4. ^ Саймон, Трейси Дж; Картун, Ури; Чжэн, Хуй; Чан, Эндрю Т; Чунг, Раймонд Т; Шоу, Стэнли; Кори, Кэтлин Э (2017). «Na Score соңғы сатыдағы бауыр ауруы моделі бауырдың алкогольсіз майлы ауруымен ауыратын жүрек-қан тамырлары оқиғаларын болжайды». Гепатологиялық коммуникация. 1 (5): 429–438. дои:10.1002 / hep4.1051. PMC  5659323. PMID  29085919.
  5. ^ Кори, Кэтлин Е; Картун, Ури; Чжэн, Хуй; Чунг, Раймонд Т; Шоу, Стэнли Y (2016). «Бауырдың алкогольсіз майлы ауруы кезіндегі дәстүрлі емес жүрек-қан тамырлары қаупі факторларын анықтау үшін электрондық медициналық жазбалар базасын қолдану». Американдық гастроэнтерология журналы. 111 (5): 671–6. дои:10.1038 / ajg.2016.44. PMC  4864030. PMID  26925881.
  6. ^ Картун, Ури; т.б. (2018). «Дәрігердің ұйқысыздығымен науқастарды анықтау алгоритмін құру». Ғылыми баяндамалар. 8 (1): 7862. Бибкод:2018NATSR ... 8.7862K. дои:10.1038 / s41598-018-25312-z. PMC  5959894. PMID  29777125.
  7. ^ Мейстре, С.М; Савова, Г.К; Киппер-Шулер, К. Хердл, Дж. Ф (2008). «Электрондық денсаулық жазбасындағы мәтіндік құжаттардан ақпарат алу: соңғы зерттеулерге шолу». Медициналық информатика жылнамасы: 128–44. PMID  18660887.
  8. ^ Ван, Яньшань; Ван, Ливей; Растегар-Моджарад, Маджид; Ай, Сунгрим; Шен, Фейхен; Афзал, Навид; Лю, Сидзия; Ценг, Югун; Мехраби, Саид; Сон, Сунхван; Liu, Hongfang (2018). «Клиникалық ақпаратты шығаруға арналған қосымшалар: әдеби шолу». Биомедициналық информатика журналы. 77: 34–49. дои:10.1016 / j.jbi.2017.11.011. PMC  5771858. PMID  29162496.
  9. ^ CACM қызметкерлері (2018). «Пациенттердің нәтижелерін жақсарту үшін мәтінді дәлірек талдау». ACM байланысы. 61 (10): 6–7. дои:10.1145/3273019. S2CID  52901757.
  10. ^ «GitHub - kartoun / text-nailing». 2018-01-07.
  11. ^ https://dl.acm.org/citation.cfm?id=3231559
  12. ^ Чен, Джонатан Х; Asch, Steven M (2017). «Медицинадағы машиналық оқыту және болжау - көбейтілген үміттердің шыңынан тыс». Жаңа Англия Медицина журналы. 376 (26): 2507–9. дои:10.1056 / NEJMp1702071. PMC  5953825. PMID  28657867.
  13. ^ CACM қызметкерлері (2017). «Қатал күштен тыс». ACM байланысы. 60 (10): 8–9. дои:10.1145/3135241.
  14. ^ Картун, Ури (2018). «Медицинада деректерге негізделген қорытындыларды жедел қабылдау жолында». Медицина, денсаулық сақтау және философия. 22 (1): 153–157. дои:10.1007 / s11019-018-9845-ж. PMID  29882052. S2CID  46973857.