Колмогоровтың құрылымдық қызметі - Kolmogorov structure function

1973 жылы Колмогоров статистикаға және модельдерді таңдауға ықтимал емес көзқарасты ұсынды. Әрбір санақ ақырлы екілік жол, ал модель екілік жолдардың ақырлы жиынтығы болсын. Берілген максимум модельдерінен тұратын модельдік сыныптарды қарастырайық Колмогоровтың күрделілігі мәтіндері Колмогоровтың құрылымдық қызметі жеке деректер жолының моделдер класындағы күрделілік деңгейінің шектелуі мен мәліметтер құрамындағы сыныптағы модельдің ең төменгі лог-кардиенталдығы арасындағы байланысты білдіреді. Құрылым функциясы бәрін анықтайды стохастикалық жеке деректер жолының қасиеттері: әрбір шектеулі модель сыныбы үшін ол шынайы модель қарастырылған модель класында болғандығына қарамастан класс ішіндегі ең қолайлы модельді анықтайды. Классикалық жағдайда біз ықтималдық үлестірімі бар мәліметтер жиынтығы туралы айтамыз, ал қасиеттері күтуге болады. Керісінше, біз мұнда жеке деректер тізбегімен және жеке жолдың қасиеттерімен айналысамыз. Бұл параметрде қасиет классикалық жағдайдағыдай үлкен ықтималдықпен емес, сенімділікпен орындалады. Колмогоровтың құрылымы функциясы жеке деректерге қатысты жеке модельдің сәйкестігін дәл анықтайды.

Колмогоров құрылымының функциясы алгоритмдік ақпарат теориясы, а. құрылымын сипаттағаны үшін Колмогоров күрделілігі теориясы деп те аталады жіп пайдалану арқылы модельдер күрделене түсетін.

Колмогоровтың анықтамасы

Колмогоров (сол жақта) құрылым функциясы туралы айтады (тақтадағы суретті қараңыз) (Таллин, 1973).

Құрылым функциясы алғашында ұсынылған Колмогоров 1973 жылы Таллинде өткен кеңестік ақпарат теориясы симпозиумында, бірақ бұл нәтижелер жарияланған жоқ[1] б. 182. Бірақ нәтижелер жарияланды[2] 1974 жылы Колмогоровтың жалғыз жазбаша жазбасы. Оның соңғы ғылыми тұжырымдарының бірі (орыс тілінен аударған Л.А. Левин):

Әрбір конструктивті нысанға функция сәйкес келеді натурал санның k - күрделіліктің максимумына анықтама беруге мүмкіндік беретін х құрамды жиынтықтардың минималды кардиналының журналы. Егер x элементінің өзі қарапайым анықтамаға мүмкіндік берсе, онда функция тіпті кіші к үшін 0-ге дейін төмендейді. Мұндай анықтаманың жоқтығы, элемент теріс мағынада «кездейсоқ». Бірақ ол функциясы болған кезде ғана «ықтималдық кездейсоқ» болады құнды қабылдаған салыстырмалы түрде аз , содан кейін шамамен өзгереді .

— Колмогоров, жоғарыда келтірілген хабарландыру

Қазіргі заманғы анықтама

Бұл туралы мұқабада және Томаста талқыланады.[1] Ол Верещагинде және Витания[3] Мұндағы негізгі қасиеттер шешілген.Колмогоровтың құрылымының функциясын келесі түрде жазуға болады

қайда - ұзындықтың екілік жолы бірге қайда үшін ойластырылған модель (n ұзындықтағы жолдар жиынтығы) , болып табылады Колмогоровтың күрделілігі туралы және - бұл қарастырылған күрделілікті шектейтін теріс емес бүтін мән . Бұл функция өспейтіні және жететіні анық үшін қайда өзгерту үшін қажетті биттердің саны ішіне және болып табылады Колмогоровтың күрделілігі туралы .

Алгоритмдік жеткілікті статистика

Біз жиынтықты анықтаймыз құрамында осындай

.

Функция сәйкес анықталған L жеткіліктілік сызығынан диагональдан төмен тұрақты тәуелсіз тұрақтыдан артық ешқашан кемімейді

.

Оған график бойынша тұрақты қашықтыққа жақындайды белгілі бір дәлелдер үшін (мысалы, үшін ). Бұлар үшін бізде бар және онымен байланысты модель (куә ) үшін оңтайлы жиынтық деп аталады , және оның сипаттамасы биттер сондықтан алгоритмдік жеткілікті статистика. Біз шартты түрде «Колмогоров күрделілігіне» алгоритмдік деп жазамыз. Алгоритмнің негізгі қасиеттері жеткілікті статистикалық мыналар: егер үшін алгоритмдік жеткілікті статистика болып табылады , содан кейін

.

Яғни, екі бөлімнен тұратын сипаттама моделін қолдану және индекс индексі-модельге код ретінде тізбесінде жылы бит, ең қысқа бір бөлік код сияқты қысқа жылы биттер. Мұны оңай көруге болады:

,
Құрылым функциялары

тікелей теңсіздіктер мен жеткіліктілік қасиетін пайдаланып, біз мұны табамыз . (Мысалы, берілген , біз сипаттай аламыз өздігінен бөлінетін (оның соңын анықтауға болады) бит.) Сондықтан кездейсоқтықтың жетіспеушілігі туралы жылы тұрақты болып табылады, бұл дегеніміз - бұл S-дің типтік (кездейсоқ) элементі құрамында бұл статистика жеткіліксіз. Алгоритмдік жеткілікті статистика үшін жақсы қасиеттерге ие модельден басқа қосымша қасиеттері бар сондықтан Колмогоровтың күрделілігі ақпараттың симметриясы (туралы ақпарат жылы туралы ақпаратпен бірдей х) бізде бар : жеткілікті алгоритмдік статистика - бұл толығымен дерлік анықталатын ең жақсы модель . ( - бұл ең қысқа бағдарлама .) Алгоритмдік жеткілікті статистика, ең азмен байланысты алгоритмдік деп аталады минималды жеткілікті статистика.

Суретке қатысты: MDL құрылымының қызметі төменде түсіндіріледі. Сәйкестік құрылымы функциясы кез-келген модельдің ең аз кездейсоқ жетіспеушілігі (жоғарыдан қараңыз) үшін осындай . Бұл құрылым функциясы модельге жарамдылықты береді (жол бар х) жол үшін x. Төмен болған кезде модель жақсы сәйкес келеді, ал жоғары болған кезде модель жақсы сәйкес келмейді. Егер кейбіреулер үшін онда типтік модель бар үшін осындай және S үшін типтік (кездейсоқ), яғни х үшін ең қолайлы модель болып табылады. Толығырақ ақпаратты мына жерден қараңыз[1] және әсіресе[3] және.[4]

Қасиеттерді таңдау

Шектеу шеңберінде график кем дегенде 45 градус бұрышпен төмендейді, ол n-ден басталып, шамамен аяқталады , әр график (а дейін аргумент пен мәндегі аддитивті термин) кейбір мәліметтердің құрылымдық функциясы арқылы жүзеге асырылады х және керісінше. График бірінші диагональға түскен кезде аргумент (күрделілік) минималды жеткілікті статистиканың дәлелі болып табылады. Бұл орынды анықтау мүмкін емес. Қараңыз.[3]

Негізгі мүлік

Әр деңгейде екендігі дәлелденді құрылым функциясының күрделілігі бізге ең жақсы модельді таңдауға мүмкіндік береді жолағындағы жеке жол үшін x үлкен ықтималдықпен емес, сенімділікпен.[3]

MDL нұсқасы

The Сипаттаманың минималды ұзындығы (MDL) функциясы: берілген максималды Колмогоров күрделілігінің жиынтықтарының модельдік класындағы K (S) моделінің құны мен S-дегі х индексінің ұзындығынан тұратын х үшін минималды екі бөлік кодының ұзындығы , S жоғарғы күрделілігі , MDL функциясы немесе шектеулі MDL бағалаушысы арқылы берілген:

қайда - S моделінің көмегімен х-тің екі бөліктен тұратын кодының жалпы ұзындығы.

Негізгі мүлік

Әр деңгейде екендігі дәлелденді күрделілігі құрылым функциясы жолақ ішіндегі x жолына арналған S моделін таңдауға мүмкіндік береді үлкен ықтималдықпен емес, сенімділікпен.[3]

Статистикада қолдану

Жоғарыда дамыған математика негізі ретінде алынды MDL оны ойлап тапқан адам Джорма Риссанен.[5]

Ықтималдық модельдері

Ықтималдықтардың әр таралуы үшін оны дәлелдеуге болады[6] бұл

.

Мысалы, егер жиынтықта есептелетін үлестіру болып табылады ұзын жіптер , содан кейін әрқайсысы ықтималдығы бар . Колмогоровтың құрылымдық функциясы айналады

Мұндағы x - ұзындығы n болатын екілік жол қайда ойластырылған модель (ықтималдықтың есептелетін мүмкіндігі) -ұзындық жолдары) үшін , болып табылады Колмогоровтың күрделілігі туралы және - бұл қарастырылған күрделілікті шектейтін бүтін мән . Бұл функция өспейтіні және жететіні анық үшін мұндағы c - өзгерту үшін қажетті биттердің саны ішіне және болып табылады Колмогоровтың күрделілігі туралы . Содан кейін . Әрбір күрделілік деңгейі үшін функциясы Колмогоровтың күрделі нұсқасы максималды ықтималдығы (ML).

Негізгі мүлік

Әр деңгейде екендігі дәлелденді құрылым функциясының күрделілігі бізге ең жақсы модельді таңдауға мүмкіндік береді жеке жол үшін жолағында үлкен ықтималдықпен емес, сенімділікпен.[3]

MDL нұсқасы және ықтималдық модельдері

MDL функциясы: моделдің құны K (P) және ұзындығынан тұратын x үшін минималды екі бөлік кодының ұзындығы Берілген максималды күрделіліктің массалық функцияларының есептелетін ықтималдықтарының модельдік класында , P күрделілігі жоғарғы шектелген , MDL функциясы немесе шектеулі MDL бағалаушысы арқылы берілген:

қайда - P моделінің көмегімен х-тің екі бөліктен тұратын кодының жалпы ұзындығы.

Негізгі мүлік

Әр деңгейде екендігі дәлелденді күрделілігі MDL функциясы жолақ ішіндегі x жолына ең жақсы P моделін таңдауға мүмкіндік береді үлкен ықтималдықпен емес, сенімділікпен.[3]

Бұрмалау мен денонизациялау деңгейіне дейін кеңейту

Бұл теорияны кеңейтуге болады жылдамдықтың бұрмалануы жеке шекті тізбектердің және denoising жеке шекті тізбектер[7] Колмогоровтың күрделілігін қолдана отырып. Нақты компрессорлық бағдарламаларды қолданатын эксперименттер сәтті өтті.[8] Мұнда табиғи мәліметтер үшін Колмогоровтың күрделілігі жақсы компрессорды қолданатын сығылған нұсқа ұзындығынан алыс емес деген болжам бар.

Пайдаланылған әдебиеттер

  1. ^ а б c Мұқабасы, Томас М .; Томас, Джой А. (1991). Ақпарат теориясының элементтері. Нью-Йорк: Вили. бет.175–178. ISBN  978-0471062592.
  2. ^ Успехидегі Мәскеу математикалық қоғамына арналған баяндаманың тезисі. Наук 29-том, 4-шығарылым (178) Мәскеу математикалық қоғамының коммуникациясы 155-бетте (орыс тілінде, ағылшын тіліне аударылмаған)
  3. ^ а б c г. e f ж Верещагин, Н.К .; Витании, П.М.Б. (1 желтоқсан 2004). «Колмогоровтың құрылымдық функциялары және модельді таңдау». Ақпараттық теория бойынша IEEE транзакциялары. 50 (12): 3265–3290. arXiv:cs / 0204037. дои:10.1109 / TIT.2004.838346.
  4. ^ Гакс, П .; Тромп, Дж. Т .; Витании, П.М.Б. (2001). «Алгоритмдік статистика». Ақпараттық теория бойынша IEEE транзакциялары. 47 (6): 2443–2463. arXiv:математика / 0006233. дои:10.1109/18.945257.
  5. ^ Риссанен, Джорма (2007). Статистикалық модельдеудегі ақпарат және күрделілік (Онлайн-Аусг. Ред.). Нью-Йорк: Спрингер. ISBN  978-0-387-36610-4.
  6. ^ А.Х. Шен, Колмогоров мағынасындағы (α, β) -стохастика туралы түсінік және оның қасиеттері, кеңестік математика. Докл., 28: 1 (1983), 295-299
  7. ^ Верещагин, Николай К .; Витании, Пол М.Б. (1 шілде 2010). «Колмогоров күрделілігін пайдаланып жеке деректердің жылдамдығын бұрмалау және денонизациялау». Ақпараттық теория бойынша IEEE транзакциялары. 56 (7): 3438–3454. arXiv:cs / 0411014. дои:10.1109 / TIT.2010.2048491.
  8. ^ де Руй, Стивен; Витании, Павел (1 наурыз 2012). «Жеке деректердің жылдамдық-бұрмалану графиктерін жақындастыру: ысырапты сығымдау және денонизациялау тәжірибелері». Компьютерлердегі IEEE транзакциялары. 61 (3): 395–407. arXiv:cs / 0609121. дои:10.1109 / ТК.2011.25.

Әдебиет