OCR-A - OCR-A

OCR-A
OCR-A font.svg
СанатSans-serif
ДизайнерАмерикандық типтің негізін қалаушылар
Тапсырыс бергенАмерикандық ұлттық стандарттар институты
Шығарылған күні1968[1]
ВариацияларOCR-A кеңейтілген
OCR A.svg типтік үлгісі
Үлгі

OCR-A Бұл қаріп 1968 жылы, компьютердің алғашқы кезеңінде жасалған таңбаларды оптикалық тану, сол кездегі компьютерлермен ғана емес, адамдармен де таныла алатын қаріптің қажеттілігі болған кезде.[2] OCR-A танылатын таңбаларды қалыптастыру үшін қарапайым, жуан соққыларды қолданады.[3]Қаріп - біркелкі (ені бекітілген), принтермен глифтерді орналастыру қажет 0.254 см (0.10 дюйм), ал оқырман аралықты қабылдауы керек 0.2286 см (0.09 дюйм) және 0.4572 см (0.18 дюйм).

Стандарттау

OCR-A шрифті стандартталған Американдық ұлттық стандарттар институты (ANSI) ANSI X3.17-1981 ретінде. X3.4 содан бері болды ШАҚЫРУ және қазір OCR-A стандарты деп аталады ISO 1073-1: 1976. OCR-A үшін DIN 66008 деп аталатын неміс стандарты да бар.[4]

Іске асыру

1968 жылы, Американдық типтің негізін қалаушылар OCR-A шығарды, бұл АҚШ-тың стандарттар бюросы белгілеген өлшемдерге сай келетін таңбаларды танудың алғашқы оптикалық типтерінің бірі. Дизайн қарапайым, сондықтан оны машина оңай оқи алады, бірақ адамның көзі оқуы қиынырақ.[5]

Металл түрі компьютерлік теруге жол бергендіктен, Tor Lillqvist қолданды Метафонт OCR-A қарпін сипаттау үшін.[қашан? ] Бұл анықтаманы кейіннен Ричард Б. Уэльс жетілдірді. Олардың жұмысын мына жерден алуға болады CTAN.[6]

Қаріптің ақысыз нұсқасын Microsoft Windows пайдаланушылары үшін қол жетімді ету үшін Джон Саутер Metafont анықтамаларын TrueType қолдану қазаншұңқыр және FontForge 2004 жылы.[7] 2007 жылы Gürkan Sengün а Дебиан осы іске асырудың пакеті.[8] 2008 ж. Люк Деврой Джон Саутердің іске асырылуындағы тік орналасуды түзетіп, кіші регистрдің атын жазды.[9]

Тәуелсіз, Мэттью Скала[10] пайдаланылған mftrace[11] түрлендіру үшін Метафонт 2006 жылы TrueType форматына арналған анықтамалар. 2011 жылы ол Metafont анықтамаларын қайта жазу арқылы жасалған жаңа нұсқасын шығарды. METATYPE1, контурларды аралық қадағалау қадамынсыз түзеді. 2012 жылдың 27 қыркүйегінде ол өзінің орындалуын 0,2 нұсқасына дейін жаңартты.[12]

OCR-A-ның осы ақысыз қосымшаларынан басқа, бірнеше сатушылар сататын бағдарламалар да бар.

Пайдаланыңыз

Оптикалық таңбаларды тану технологиясы мұндай қарапайым қаріптер енді қажет болмайтын деңгейге жетсе де, OCR-A қарпі қолданыста қалды. Оны қолдану кодтау кезінде кең таралған чектер бүкіл әлем бойынша. Кейбіреулер құлып қорабы компаниялар әлі күнге дейін шотты қайтару формасындағы шот нөмірі мен сомасын OCR-A-да басып шығаруды талап етеді.[13] Сондай-ақ, оның ерекше көрінісі болғандықтан, ол кейде жарнамада және дисплей графикасында қолданылады.

Атап айтқанда, ол телехикаядағы субтитр үшін қолданылады Қара тізім және негізгі атаулар үшін Претендер. Сонымен қатар, фильм үшін OCR-A қолданылады 13 сағат: Бенгазидің жасырын сарбаздары.

Код тармақтары

Қаріп - бұл таңбалар фигураларының жиынтығы, немесе глифтер. Компьютерде қаріпті қолдану үшін әр глифке а тағайындалуы керек код нүктесі ішінде таңбалар жиынтығы. OCR-A стандартталған кезде әдеттегі таңбаларды кодтау болды Ақпарат алмасудың американдық стандартты коды немесе ASCII. OCR-A глифтерінің барлығы бірдей ASCII-ге сәйкес келе бермейді, ал таңбалардың бесеуі үшін екінші қаріптің қажеттілігін болжаған балама глифтер болған. Алайда ыңғайлылық пен тиімділік үшін барлық глифтерге ASCII кодтауды қолданып, бірыңғай қаріппен қол жетімді болады, ал қосымша таңбалар, егер олар пайдаланылмаса, кодтау нүктелеріне орналастырылған.

ASCII қазіргі ұрпағы болып табылады Юникод, сондай-ақ ISO 10646. Unicode құрамында ASCII бар және OCR символдары үшін арнайы ережелер бар, сондықтан OCR-A кейбір енгізілімдері Unicode-ға таңбалар кодын тағайындауда басшылыққа алынды.

Юникодқа дейінгі стандартты ұсыну

The ISO стандартты ISO 2033: 1983 ж. Және сәйкесінше Жапондық өнеркәсіп стандарты JIS X 9010: 1984 (бастапқыда JIS C 6229-1984), OCR-A үшін таңбалық кодтауды анықтаңыз, OCR-B және E-13B. OCR-A үшін олар модификацияланған 7-биттік ASCII жиынын анықтайды (сонымен бірге онымен белгілі) ISO-IR тек ISO-IR-91 нөмірі), тек бас әріптер, цифрлар, тыныс белгілері мен таңбалар жиыны және кейбір қосымша таңбалар.[14] ASCII-ге қатысты қайта анықталған кодтар, жай ғана алынып тасталғандардан айырмашылығы, төменде келтірілген:

МінезКескінОрналасқан жеріASCII-деТүсініктемелер
£Фунт белгісі0x23#Матчтар BS 4730, Ұлыбритания нұсқасы ISO 646.[15]
{Сол жақ бұйра жақша0x28(Таңбаның аты жақшаны көрсеткенімен, әлі күнге дейін «СОЛ ПАРЕНТЕЗ» болып табылады. Әдеттегі 0x7B ASCII коды алынып тасталды.[14]
}Оң жақ бұйра жақша0x29)Таңбаның аты жақшаны көрсеткенімен, «ДҰРЫС ПАРЕНТЕЗ» болып қала береді. Әдеттегі ASCII 0x7D коды алынып тасталды.[14]
OCR ілгегі0x3C<
OCR кафедрасы0x3E>
¥Yen белгісі0x5CМатчтар JIS X 0201. JIS X 9010-ге енгізілген, бірақ ISO 2033 бойынша алынып тасталған.[14]
OCR шанышқысы0x5D]

Сонымен қатар, ұзын тік белгі (Ұзын тік белгі) ASCII тік жолағына (|) сәйкес келетін 0х7С деңгейінде кодталады.[14]

Юникодтағы арнайы OCR-A таңбалары

Келесі символдар басқару мақсатында анықталған және қазір «Таңбаларды оптикалық тану» Юникод диапазоны 2440–245F:

ASCII және Unicode негізінде арнайы OCR-A кодтық нүктелері[16]
Аты-жөніКескінМәтінЮникод
OCR ілгегіOCR ілгегіU + 2440
OCR кафедрасыOCR кафедрасыU + 2441
OCR шанышқысыOCR шанышқысыU + 2442
OCR төңкерілген шанышқыU + 2443
OCR Belt tokaU + 2444
OCR галстукU + 2445

Бос орын, цифрлар және белгіленбеген әріптер

OCR-A цифрлары
OCR-акцентсіз бас әріптер
OCR-A шоғырланбаған кішкентай әріптер

OCR-A барлық енгізілімдері кеңістік үшін U + 0020, ондық цифрлар үшін U + 0030 мен U + 0039, екпінсіз үлкен әріптер үшін U + 0041 - U + 005A, ал төменгі шектерде U + 0061 - U + 007A қолданылады. іс хаттары.

Тұрақты таңбалар

Цифрлар мен шоғырланбаған әріптерден басқа, OCR-A таңбаларының көпшілігінде ASCII-де айқын код нүктелері бар, ал көбінде, соның ішінде OCR-A-ның барлық екпінді әріптерінде, Unicode-де айқын код нүктелері бар.

ASCII және Unicode негізінде қосымша OCR-A код нүктелері
Аты-жөніГлифЮникод
Леп белгісіЛеп белгісіU + 0021
ДәйексөзДәйексөзU + 0022
Сандық белгіСандық белгіU + 0023
Доллар белгісіДоллар белгісіU + 0024
Пайыздық белгіПайыздық белгіU + 0025
АмперсандАмперсандU + 0026
АпострофАпострофU + 0027
Сол жақ жақшаСол жақ жақшаU + 0028
Оң жақ жақшаОң жақ жақшаU + 0029
ЖұлдызшаЖұлдызшаU + 002A
Қосымша белгіҚосымша белгіU + 002B
ҮтірҮтірU + 002C
Дефис-минусДефис-минусU + 002D
Нүкте (кезең)Нүкте (кезең)U + 002E
Solidus (қиғаш сызық)Solidus (қиғаш сызық)U + 002F
Қос нүктеҚос нүктеU + 003A
Нүктелі үтірНүктелі үтірU + 003B
Белгіден азБелгіден азU + 003C
Тең белгіТең белгіU + 003D
Үлкен белгіҮлкен белгіU + 003E
Сұрақ белгісіСұрақ белгісіU + 003F
Коммерциялық АтКоммерциялық АтU + 0040
Сол жақ жақшаСол жақ жақшаU + 005B
Кері Solidus (артқа қиғаш)Кері SolidusU + 005C
Оң жақ тік жақшаОң жақ тік жақшаU + 005D
Circumflex AccentCircumflex AccentU + 005E
Сол жақ бұйра жақшаСол жақ бұйра жақшаU + 007B
Оң жақ бұйра жақшаОң жақ бұйра жақшаU + 007D
Фунт белгісі (Стерлинг)Фунт белгісіU + 00A3
Yen белгісіYen белгісіU + 00A5
Дирезиспен жазылған латынның бас әріпі АДирезиспен жазылған латынның бас әріпі АU + 00C4
Жоғарыда сақинасы бар латынның бас әріпі АЖоғарыда сақинасы бар латынның бас әріпі АU + 00C5
Латындық бас әріп AEЛатындық бас әріп AEU + 00C6
Тильдамен жазылған латынның бас әріпі NТильдемен жазылған латынның бас әріпі NU + 00D1
Диерезиспен жазылған латын бас әріпі ОДиерезиспен жазылған латын бас әріпі ОU + 00D6
Инсультпен жазылған латынның бас әріпі ОИнсультпен жазылған латынның бас әріпі ОU + 00D8
Диерезиспен жазылған латынның бас әріпі UДиерезиспен жазылған латынның бас әріпі UU + 00DC

Қалған кейіпкерлер

Линотип[17] OCR-A қалған таңбаларын келесідей кодтады:

Қосымша OCR-A таңбалары
Аты-жөніГлифЮникодЮникод атауы
Ұзын тік белгіҰзын тік белгіU + 007CТік сызық

Қосымша таңбалар

Тор Лиллквист пен Ричард Б. Уэльстің шығармаларынан шыққан қаріптер ASCII таңбалар жиынтығын толтыру үшін OCR-A-да жоқ төрт таңбаны анықтайды. Бұл кескіндер OCR-A таңбаларының пішіндерімен бірдей стильді қолданады. Олар:

Қосымша ASCII таңбалары
Аты-жөніГлифЮникод
Төмен сызықТөмен сызықU + 005F
Grave AccentGrave AccentU + 0060
Тік сызықТік сызықU + 007C
ТильдаТильдаU + 007E

Линотип қосымша символдарды да анықтайды.[18]

Ерекшеліктер

Кейбір іске асыруда кейбір таңбалар үшін жоғарыда келтірілген кодтық нүктелік тағайындаулар қолданылмайды.

Дәлдік идентификаторы

OCR-A PrecisionID енгізу келесі стандартты емес кодтық нүктелерге ие:[19]

  • OCR ілгегі U + 007E
  • U + 00C1 кезіндегі OCR кафедрасы
  • U + 00C2 деңгейіндегі OCR шанышқысы
  • Еуро белгісі U + 0080

Barcodesoft

OCR-A Barcodesoft енгізуінде келесі стандартты емес кодтық нүктелер бар:[20][21]

  • OCR ілмегі U + 0060
  • OCR кафедрасы U + 007E
  • U + 005F деңгейіндегі OCR шанышқысы
  • U + 007C температурасындағы тік тік белгі (линотиппен келіседі)
  • U + 0008 кезінде таңбаны өшіру

Моровия

OCR-A Morovia енгізу келесі стандартты емес кодтық нүктелерге ие:[22]

  • OCR ілгегі U + 007E (PrecisionID-мен келіседі)
  • OCR кафедрасы U + 00F0
  • U + 005F кезінде OCR шанышқысы (Barcodesoft-пен келіседі)
  • U + 007C температурасындағы тік тік белгі (линотиппен келіседі)

IDAutomation

OCR-A-ны IDAutomation енгізу келесі стандартты емес кодтық нүктелерге ие:[23]

  • OCR ілгегі U + 007E (PrecisionID-мен келіседі)
  • U + 00C1 деңгейіндегі OCR креслолары (PrecisionID-мен келіседі)
  • U + 00C2 деңгейіндегі OCR шанышқысы (PrecisionID-мен келіседі)
  • U + 00C3 кезіндегі OCR белдік байламы

Қолданбалар

Қаріп стандарттарын сатушылар

Сондай-ақ қараңыз

Ескертулер

  1. ^ Adobe-дің OCR-A қаріпіндегі фон
  2. ^ Microscan-дан OCR-A үшін мотивация
  3. ^ «Енгізілген бағдарламалық жасақтаманың OCR туралы мәліметі». Архивтелген түпнұсқа 2016-09-17. Алынған 2012-09-01.
  4. ^ Оптикалық таңбаларды тану үшін DIN 66008-1 шрифті A; Таңбалар және номиналды өлшемдер
  5. ^ Adobe-ден OCR-A туралы ақпарат
  6. ^ CTAN-дан OCR-A үшін MetaFont көздері
  7. ^ Джон Саутердің MetaFont көздерінен алынған 2004 OCR-A шрифті
  8. ^ John De Sauter-тің SourceForge жобасына негізделген қаріптер-ocr-a Debian пакеті
  9. ^ Люк Девройдың Джон Сэйтердің OCR-A енгізуіне енгізген өзгерістері туралы жазуы
  10. ^ Мэттью Скаланың үй парағы
  11. ^ Mftrace Debian пакеті
  12. ^ Мэтью Скаланың 2012 OCR-A шрифті MetaFont көздерінен
  13. ^ Lockbox қызметінің сипаттамасы, ескерту «Есепшотта сканерленетін оптикалық таңбаларды тану (OCR) жолында емделушілер туралы ақпарат бар шот-фактура және анықтама бар. OCR желісі сыртқы түрі бойынша несиелік карта көшірмесінде немесе телефон шотында көрсетілгенге ұқсас. «
  14. ^ а б c г. e ISO / TC97 / SC2 (1985-08-01). Жапондық OCR-A графикалық таңбалар жиынтығы (PDF). ITSCJ /IPSJ. ISO-IR-91.
  15. ^ BSI (1975-12-01). Ұлыбританияның 7-разрядты деректер кодының графикалық таңбаларының жиынтығы (PDF). ITSCJ /IPSJ. ISO-IR-4.
  16. ^ https://www.unicode.org/charts/PDF/U2440.pdf
  17. ^ Linotype OCR-A қарпі: таңбалар картасын таңдап, олардың кодталуын көріңіз
  18. ^ Linotype-дің OCR-A кеңейтілген шрифті: таңбалар картасын таңдап, содан кейін бәрін көрсету
  19. ^ OCR-A қаріпін PrecisionID енгізуге арналған PrecisionID пайдаланушы нұсқаулығы
  20. ^ OCR-A қаріпін штрих-кодпен енгізуге арналған ақпарат беті
  21. ^ Штрих-код қаріптері туралы тағы бір ақпарат көзі
  22. ^ Моровиядағы OCR-A қарпін енгізу туралы ақпарат парағы
  23. ^ OCR-A және OCR-B қаріптерін IDAutomation енгізуге арналған ақпарат беті

Сыртқы сілтемелер