5 безплатни онлайн OCR услуги, тествани и прегледани

Имате PDF документ или изображение, което искате да конвертирате в текст? Наскоро някой ми изпрати документ по пощата, който трябваше да редактирам и да изпратя обратно с корекции. Човекът не можа да намери цифрово копие, така че имах задача да прехвърля целия този текст в цифров формат.

Нямаше начин да прекарам часове, за да въвеждам всичко обратно, така че накрая направих хубава висококачествена снимка на документа и след това пропирах път през куп онлайн услуги за OCR , за да видя коя ще ми даде най-доброто резултати.

В тази статия ще разгледам няколко от любимите ми сайтове за OCR , които са безплатни. Струва си да се отбележи, че повечето от тези сайтове предоставят основна безплатна услуга и след това имат платени опции, ако искате допълнителни функции като по-големи изображения, многостранични PDF документи, различни езици за въвеждане и т.н.

Също така е добре да знаете предварително, че повечето от тези услуги няма да могат да съответстват на форматирането на оригиналния ви документ. Те са основно за извличане на текст и това е всичко. Ако имате нужда всичко да бъде в определено оформление или формат, ще трябва да направите това ръчно, след като получите целия текст от OCR .

Освен това най-добрите резултати за получаване на текст ще дойдат от документи с резолюция от 200 до 400 DPI . Ако имате изображение с нисък DPI , резултатите няма да са толкова добри.

И накрая, имаше много сайтове, които тествах, които просто не работят. Ако използвате безплатно онлайн OCR в Google , ще видите куп сайтове, но няколко от сайтовете в първите 10 резултата дори не са завършили преобразуването. Някои щяха да изтекат, други дават грешки, а някои просто се забиваха на страницата за „конвертиране“, така че дори не си направих труда да споменавам тези сайтове.

За всеки сайт тествах два документа, за да видя колко добър ще бъде резултатът. За моите тестове просто използвах моя iPhone 5S, за да направя снимка на двата документа и след това ги качих директно на уебсайтовете за конвертиране.

В случай, че искате да видите как изглеждат изображенията, които използвах за моя тест, прикачих ги тук: Test1 и Test2 . Имайте предвид, че това не са версиите с пълна разделителна способност на изображенията, направени от телефона. Използвах изображението с пълна разделителна способност при качване в сайтовете.

Онлайн OCR

OnlineOCR.net е чист и прост сайт, който даде много добри резултати в моя тест. Основното нещо, което харесвам в него, е, че няма много реклами навсякъде, което обикновено се случва с тези видове сайтове за нишови услуги.

безплатно онлайн ocr

За да започнете, изберете вашия файл и изчакайте, докато завърши качването. Максималният размер за качване за този сайт е 100 MB. Ако се регистрирате за безплатен акаунт, получавате няколко допълнителни функции като по-голям размер за качване, многостранични PDF файлове(PDFs) , различни езици за въвеждане, повече реализации на час и т.н.

След това изберете вашия език за въвеждане и след това изберете изходния формат. Можете да избирате от Word , Excel или обикновен текст(Plain Text) . Щракнете върху(Click) бутона Конвертиране(Convert) и ще видите текста, показан в долната част в поле, заедно с връзка за изтегляне.

ocr изход

Ако всичко, което искате, е текстът, просто го копирайте и поставете от полето. Въпреки това ви предлагам да изтеглите документа на Word , защото той върши изненадващо страхотна работа за запазване на оформлението на оригиналния документ.

Например, когато отворих документа на Word за втория си тест, бях изненадан да открия, че документът включва таблица с три колони, точно както е на изображението.

онлайн ocr изход

От всички сайтове този беше най-добрият. Напълно си струва да се регистрирате, ако трябва да направите много реализации.

За пълнота ще направя и връзка към изходните файлове, създадени от всяка услуга, за да можете сами да видите резултатите. Ето резултатите от OnlineOCR : Test1 Doc и Test2 Doc .

Имайте предвид, че когато отваряте тези документи на Word на вашия компютър, ще получите съобщение в Word , че е от интернет(Internet) и редактирането е деактивирано. Това е напълно ОК, защото Word не вярва на документи от Интернет(Internet) и наистина не е нужно да активирате редактиране, ако просто искате да видите документа.

i2OCR

Друг сайт, който даде доста добри резултати, беше i2OCR . Процесът е много подобен: изберете вашия език, файл и след това натиснете Извличане на текст(Extract Text) .

i2ocr

Тук ще трябва да изчакате минута или две, защото този сайт отнема малко повече време. Също така, в Стъпка 2(Step 2) , уверете се, че изображението ви се показва с дясната страна нагоре в визуализацията, в противен случай ще получите куп глупости като изход. По някаква причина изображенията от моя iPhone се показваха в портретен режим на компютъра ми, но пейзаж, когато качих на този сайт.

i2ocr изход

Трябваше ръчно да отворя изображението в приложение за редактиране на снимки, да го завъртя на 90 градуса, след това да го завъртя обратно към портрет и след това да го запазя отново. След като(Once) приключите, превъртете надолу и ще ви покаже визуализация на текста заедно с бутон за изтегляне.

Този сайт се справи доста добре с изхода за първия тест, но не се справи толкова добре с втория тест, който имаше оформление на колоните. Ето резултатите от i2OCR: Test1 Doc и Test2 Doc .

FreeOCR

Free-OCR.com ще вземе вашите изображения и ще ги преобразува в обикновен текст. Няма опция за експортиране във формат Word . Изберете вашия файл, изберете език и след това щракнете върху Старт(Start) .

Сайтът е бърз и ще получите резултата доста бързо. Просто(Just) кликнете върху връзката, за да изтеглите текстовия файл на вашия компютър.

freeocr

Както при споменатото по-долу NewOCR , този сайт изписва с главни букви всички T в документа. (NewOCR)Нямам представа защо ще направи това, но по някаква странна причина и този сайт, и NewOCR направиха това. Не е голяма работа да го промените, но това е досаден процес, който наистина не трябва да правите.

Ето резултатите от FreeOCR: Test1 Doc и Test2 Doc .

ABBYY FineReader Онлайн

За да използвате FineReader Online , трябва да се регистрирате за акаунт, което ви дава 15-дневен безплатен пробен период за OCR до 10 страници безплатно. Ако трябва да направите само еднократно OCR за няколко страници, тогава можете да използвате тази услуга. Уверете(Make) се, че щракнете върху връзката за потвърждение в имейла за потвърждение, след като се регистрирате.

finereader онлайн

Щракнете върху Разпознаване(Recognize) в горната част и след това щракнете върху Качване(Upload) , за да изберете вашия файл. Изберете вашия език, изходен формат и след това щракнете върху Разпознаване(Recognize) в долната част. Този сайт има изчистен интерфейс и също няма реклами.

В моите тестове този сайт успя да вземе текста от първия тестов документ, но беше абсолютно огромен, когато отворих документа на Word , така че в крайна сметка го направих отново и избрах обикновен текст(Plain Text) като изходен формат.

За втория тест с колоните документът на Word беше празен и дори не можах да намеря текста. Не съм сигурен какво се е случило там, но изглежда не може да се справи с нищо друго освен с прости параграфи. Ето резултатите от FineReader: Test1 Doc и Test2 Doc .

Ново OCR

Следващият сайт, NewOCR.com , беше добре, но не толкова добър като първия сайт. Първо, има реклами, но за щастие няма много. Първо избирате своя файл и след това щракнете върху бутона Визуализация(Preview) .

качи изображение

След това можете да завъртите изображението и да коригирате областта, където искате да сканирате за текст. Това до голяма степен прилича на това как процесът на сканиране работи на компютър с прикачен скенер.

ocr изображение

Ако документът има няколко колони, можете да проверите бутона за анализ на оформлението на страницата( Page layout analysis) и той ще се опита да раздели текста на колони. Щракнете върху(Click) бутона OCR , изчакайте няколко секунди да завърши и след това превъртете надолу до дъното, когато страницата се опресни.

В първия тест получи целия текст правилно, но по някаква причина всяко Т в документа беше изписано с главни букви! Нямам представа защо ще направи това, но го направи. При втория тест с активиран анализ на страниците получи по-голямата част от текста, но оформлението беше напълно изключено.

Ето резултатите от NewOCR: Test1 Doc  и Test2 Doc .

Заключение

Както можете да видите, безплатното всъщност не ви дава много добри резултати през повечето време за съжаление. Първият споменат сайт е най-добрият досега, защото не само свърши страхотна работа по разпознаването на целия текст, но също така успя да запази формата на оригиналния документ.

Ако имате нужда само от текст обаче, повечето от уебсайтовете по-горе трябва да могат да направят това вместо вас. Ако имате въпроси, не се колебайте да коментирате. Наслади се!



About the author

Аз съм софтуерен инженер с над 15 години опит в Microsoft Office и Edge. Също така разработих няколко инструмента, използвани от крайните потребители, като например приложение за проследяване на важни здравни данни и детектор за рансъмуер. Моите умения се състоят в разработването на елегантен код, който работи добре на различни платформи, както и в отличното разбиране на потребителското изживяване.



Related posts