5 безплатни онлайн OCR услуги, тествани и прегледани
Имате PDF документ или изображение, което искате да конвертирате в текст? Наскоро някой ми изпрати документ по пощата, който трябваше да редактирам и да изпратя обратно с корекции. Човекът не можа да намери цифрово копие, така че имах задача да прехвърля целия този текст в цифров формат.
Нямаше начин да прекарам часове, за да въвеждам всичко обратно, така че накрая направих хубава висококачествена снимка на документа и след това пропирах път през куп онлайн услуги за OCR , за да видя коя ще ми даде най-доброто резултати.
В тази статия ще разгледам няколко от любимите ми сайтове за OCR , които са безплатни. Струва си да се отбележи, че повечето от тези сайтове предоставят основна безплатна услуга и след това имат платени опции, ако искате допълнителни функции като по-големи изображения, многостранични PDF документи, различни езици за въвеждане и т.н.
Също така е добре да знаете предварително, че повечето от тези услуги няма да могат да съответстват на форматирането на оригиналния ви документ. Те са основно за извличане на текст и това е всичко. Ако имате нужда всичко да бъде в определено оформление или формат, ще трябва да направите това ръчно, след като получите целия текст от OCR .
Освен това най-добрите резултати за получаване на текст ще дойдат от документи с резолюция от 200 до 400 DPI . Ако имате изображение с нисък DPI , резултатите няма да са толкова добри.
И накрая, имаше много сайтове, които тествах, които просто не работят. Ако използвате безплатно онлайн OCR в Google , ще видите куп сайтове, но няколко от сайтовете в първите 10 резултата дори не са завършили преобразуването. Някои щяха да изтекат, други дават грешки, а някои просто се забиваха на страницата за „конвертиране“, така че дори не си направих труда да споменавам тези сайтове.
За всеки сайт тествах два документа, за да видя колко добър ще бъде резултатът. За моите тестове просто използвах моя iPhone 5S, за да направя снимка на двата документа и след това ги качих директно на уебсайтовете за конвертиране.
В случай, че искате да видите как изглеждат изображенията, които използвах за моя тест, прикачих ги тук: Test1 и Test2 . Имайте предвид, че това не са версиите с пълна разделителна способност на изображенията, направени от телефона. Използвах изображението с пълна разделителна способност при качване в сайтовете.
Онлайн OCR
OnlineOCR.net е чист и прост сайт, който даде много добри резултати в моя тест. Основното нещо, което харесвам в него, е, че няма много реклами навсякъде, което обикновено се случва с тези видове сайтове за нишови услуги.
За да започнете, изберете вашия файл и изчакайте, докато завърши качването. Максималният размер за качване за този сайт е 100 MB. Ако се регистрирате за безплатен акаунт, получавате няколко допълнителни функции като по-голям размер за качване, многостранични PDF файлове(PDFs) , различни езици за въвеждане, повече реализации на час и т.н.
След това изберете вашия език за въвеждане и след това изберете изходния формат. Можете да избирате от Word , Excel или обикновен текст(Plain Text) . Щракнете върху(Click) бутона Конвертиране(Convert) и ще видите текста, показан в долната част в поле, заедно с връзка за изтегляне.
Ако всичко, което искате, е текстът, просто го копирайте и поставете от полето. Въпреки това ви предлагам да изтеглите документа на Word , защото той върши изненадващо страхотна работа за запазване на оформлението на оригиналния документ.
Например, когато отворих документа на Word за втория си тест, бях изненадан да открия, че документът включва таблица с три колони, точно както е на изображението.
От всички сайтове този беше най-добрият. Напълно си струва да се регистрирате, ако трябва да направите много реализации.
За пълнота ще направя и връзка към изходните файлове, създадени от всяка услуга, за да можете сами да видите резултатите. Ето резултатите от OnlineOCR : Test1 Doc и Test2 Doc .
Имайте предвид, че когато отваряте тези документи на Word на вашия компютър, ще получите съобщение в Word , че е от интернет(Internet) и редактирането е деактивирано. Това е напълно ОК, защото Word не вярва на документи от Интернет(Internet) и наистина не е нужно да активирате редактиране, ако просто искате да видите документа.
i2OCR
Друг сайт, който даде доста добри резултати, беше i2OCR . Процесът е много подобен: изберете вашия език, файл и след това натиснете Извличане на текст(Extract Text) .
Тук ще трябва да изчакате минута или две, защото този сайт отнема малко повече време. Също така, в Стъпка 2(Step 2) , уверете се, че изображението ви се показва с дясната страна нагоре в визуализацията, в противен случай ще получите куп глупости като изход. По някаква причина изображенията от моя iPhone се показваха в портретен режим на компютъра ми, но пейзаж, когато качих на този сайт.
Трябваше ръчно да отворя изображението в приложение за редактиране на снимки, да го завъртя на 90 градуса, след това да го завъртя обратно към портрет и след това да го запазя отново. След като(Once) приключите, превъртете надолу и ще ви покаже визуализация на текста заедно с бутон за изтегляне.
Този сайт се справи доста добре с изхода за първия тест, но не се справи толкова добре с втория тест, който имаше оформление на колоните. Ето резултатите от i2OCR: Test1 Doc и Test2 Doc .
FreeOCR
Free-OCR.com ще вземе вашите изображения и ще ги преобразува в обикновен текст. Няма опция за експортиране във формат Word . Изберете вашия файл, изберете език и след това щракнете върху Старт(Start) .
Сайтът е бърз и ще получите резултата доста бързо. Просто(Just) кликнете върху връзката, за да изтеглите текстовия файл на вашия компютър.
Както при споменатото по-долу NewOCR , този сайт изписва с главни букви всички T в документа. (NewOCR)Нямам представа защо ще направи това, но по някаква странна причина и този сайт, и NewOCR направиха това. Не е голяма работа да го промените, но това е досаден процес, който наистина не трябва да правите.
Ето резултатите от FreeOCR: Test1 Doc и Test2 Doc .
ABBYY FineReader Онлайн
За да използвате FineReader Online , трябва да се регистрирате за акаунт, което ви дава 15-дневен безплатен пробен период за OCR до 10 страници безплатно. Ако трябва да направите само еднократно OCR за няколко страници, тогава можете да използвате тази услуга. Уверете(Make) се, че щракнете върху връзката за потвърждение в имейла за потвърждение, след като се регистрирате.
Щракнете върху Разпознаване(Recognize) в горната част и след това щракнете върху Качване(Upload) , за да изберете вашия файл. Изберете вашия език, изходен формат и след това щракнете върху Разпознаване(Recognize) в долната част. Този сайт има изчистен интерфейс и също няма реклами.
В моите тестове този сайт успя да вземе текста от първия тестов документ, но беше абсолютно огромен, когато отворих документа на Word , така че в крайна сметка го направих отново и избрах обикновен текст(Plain Text) като изходен формат.
За втория тест с колоните документът на Word беше празен и дори не можах да намеря текста. Не съм сигурен какво се е случило там, но изглежда не може да се справи с нищо друго освен с прости параграфи. Ето резултатите от FineReader: Test1 Doc и Test2 Doc .
Ново OCR
Следващият сайт, NewOCR.com , беше добре, но не толкова добър като първия сайт. Първо, има реклами, но за щастие няма много. Първо избирате своя файл и след това щракнете върху бутона Визуализация(Preview) .
След това можете да завъртите изображението и да коригирате областта, където искате да сканирате за текст. Това до голяма степен прилича на това как процесът на сканиране работи на компютър с прикачен скенер.
Ако документът има няколко колони, можете да проверите бутона за анализ на оформлението на страницата( Page layout analysis) и той ще се опита да раздели текста на колони. Щракнете върху(Click) бутона OCR , изчакайте няколко секунди да завърши и след това превъртете надолу до дъното, когато страницата се опресни.
В първия тест получи целия текст правилно, но по някаква причина всяко Т в документа беше изписано с главни букви! Нямам представа защо ще направи това, но го направи. При втория тест с активиран анализ на страниците получи по-голямата част от текста, но оформлението беше напълно изключено.
Ето резултатите от NewOCR: Test1 Doc и Test2 Doc .
Заключение
Както можете да видите, безплатното всъщност не ви дава много добри резултати през повечето време за съжаление. Първият споменат сайт е най-добрият досега, защото не само свърши страхотна работа по разпознаването на целия текст, но също така успя да запази формата на оригиналния документ.
Ако имате нужда само от текст обаче, повечето от уебсайтовете по-горе трябва да могат да направят това вместо вас. Ако имате въпроси, не се колебайте да коментирате. Наслади се!
Related posts
5-те най-добри сайта за намиране на онлайн преподавател за възрастни и деца
Как да слушате радиостанции онлайн безплатно
10-те най-добри сайта за безплатно гледане на карикатури онлайн
6 сайта за игра на ретро игри онлайн безплатно
Започнете онлайн дневник с тези 6 най-добри уебсайта и приложения
6 най-добри луксозни сайтове за онлайн пазаруване
7 най-добри безплатни онлайн таймера, които трябва да направите отметка
7-те най-добри онлайн източника за безплатни филтри за Photoshop
9 изненадващи неща, които можете да поръчате онлайн, за да спестите време
10 сайта за търсене, за да намерите хора онлайн
7 начина да преглеждате и наблюдавате кредитния си рейтинг онлайн безплатно
4 най-добри уебсайта за безплатно гледане на аниме онлайн
10 най-добри сайта за отпечатване на цифрови снимки онлайн
8 най-добри безплатни онлайн сайтове за сканиране и премахване на вируси
Как да намерите евтини полети онлайн и да победите авиокомпаниите
6 безплатни онлайн инструмента за споделяне на екрана
3-те най-добри онлайн приложения Pomodoro
7 най-добри акредитирани онлайн курса за научаване на компютрите
5-те най-добри онлайн източника за закупуване на използвани учебници
7 най-добри безплатни онлайн сайтове за пасианси, които да играете, когато ви е скучно