Оптично символно разпознаване (YAGF)

Оптичното символно разпознаване е процес, при който текстов документ се сканира като изображение и след това с помощта на специално приложение текста в него се разпознава и се запазва на компютъра като текстов файл. Това е много полезно в случай, в които разполагате с даден документ само в хартиен вид, а ви е необходимо да използвате части него или целия при работата с компютър.

В УСУ ще намерите именно такова приложение. Можете да го стартирате от Програми – Графика – Оптично символно разпознаване (YAGF). Ще видите подобен прозорец:

yagf_1.png

Интерфейса на програмата се състои от лента с интрументи и два панела. В левия панел ще се показва зареденото изображение, а в десния разпознатия текст. Ето как става това:

  • Зареждане/сканиране на файл – използвайте двата крайно леви бутона, за да заредите вече сканирано изображение или директно да сканирате документ чрез свързан към системата скенер.

Забележка: За да работи директното сканиране, ще трябва от Мениджъра на пакети да си инсталирате приложението xsane.

В примера ще отворим предварително сканиран документ, който веднага ще се покаже в левия панел:

yagf_2.png

  • Подготовка изображението за разпознаване

Тук има няколко допълнителни стъпки, които трябва да изпълните, преди да се пристъпи към разпознаване. Първата от тях е да изберете дали ще се сканира цялото изображение или само интересуваща ви област от него. За това ще ви помогнат няколко инструмента, намиращи се непосредствено над левия панел:

yagf_3.png

С тях можете да маркирате определена част от изображенето, да приближавате/отдалечавате, да завъртате и т.н. За да маркирате част от изображението, първо цъкнете на иконата, представяща показалец на мишка. След това цъкнете в изображението и задръжайки левия бутон очертайте областта, която желаете да се сканира. Тя ще се маркира със син правоъгълник:

yagf_4.png

Второто нещо, което трябва да направите, е да определите какъв език да се използва за разпознаването на текста. Добрият краен резултат от разпознаването в голяма степен зависи от правилното определяне на езика. Може да направите това чрез падащото меню Език за разпознаване, намиращо се в лентата с интрументи. Към момента в списъка с налични езици не фигурира Български, но спокойно можете да изберете Руски в случай, че желаете да разпознаете текст на роден език. Възможни са и комбинации между различни езици, напр. Руски и Английски. Те са полезни, когато в разпознатия текст има символи на различни езици.

  • Разпознаване на текста

За да стартирате процедурата по разпознаване на текста използвайте един от двата бутона в лентата с интрументи:

yagf_5.png

Левият стартира разпознаване на текущата страница, а десния – на всички страници, ако са заредени множество изображения. Разпознаването може да отнеме известно време, в зависимост от обема на текста, след което резултата се показва в десния панел под формата на обикновен текст:

yagf_6.png

  • Запазване на текста

След като прегледате получения текст и внесете корекции, може да го запазите за последващо използване. Можете да го запазите като обикновен текстов файл или като файл във формат HTML. Вида файл можете да го изберете от падащото меню Изходен формат в лентата с инструменти, след което от менюто файл можете за го запазите на желано от вас място.

И накрая – два съвета, които ще ви помогнат да постигнете по-хубаво разпознаване:

– сканирайте изображенията с поне 200 DPI, за да се различават повече детайли;
– сканирайте изображенията в черно-бял режим или в степени на сивото – така ще се избегнат различни дефекти по тях причинени от недобро предаване на цветовете.

Sidebar