Często trafiamy na ważny dokument, wydrukowany list, artykuł z gazety, paragon, fakturę lub inny tekst, który chcemy zachować. Na szczęście te wartościowe teksty można łatwo zamienić na formę cyfrową za pomocą OCR (Optical Character Recognition, optyczne rozpoznawanie znaków).
Wszystko, co dziś „przelewamy na papier”, istnieje w formie cyfrowej. Poza tym, że jest to proste, konwersja tekstu do formy cyfrowej otwiera wiele możliwości. Na przykład ułatwia edycję.
Po zeskanowaniu tekstów za pomocą skanera lub nawet telefonu pojawia się pytanie: jak wyodrębnić tekst z obrazu przy użyciu OCR? Nie ma potrzeby przepisywać wszystkiego ręcznie, ponieważ technologia OCR oferuje szybkie i proste rozwiązanie. Co więcej, korzystając z internetowego konwertera OCR, zamienisz tekst na cyfrowy w kilka chwil. Poniżej dowiesz się, jak przekonwertować zeskanowany dokument na tekst.
Jak zdigitalizować stare teksty?
Chociaż łatwo jest przenieść zakurzone papierowe dokumenty do formy cyfrowej, wciąż istnieje kilka kwestii, o których warto pamiętać, aby uzyskać lepsze wyniki i wydajność OCR.
Aby uzyskać jak najlepsze rezultaty, tekst powinien być czytelny i napisany maszynowo. Zrób wyraźne zdjęcie dokumentu, który chcesz skonwertować. Jeśli chcesz zeskanować tekst odręczny, wynik konwersji będzie zależał od tego, jak czytelne jest pismo. Nawet wtedy nie będzie on idealny, ponieważ teksty odręczne wciąż rzadko są poprawnie interpretowane przez OCR. Jednak w najbliższej przyszłości możemy spodziewać się postępu technologicznego w tej dziedzinie.
Czy mogę poprawić jakość skanu?
Aby mieć pewność, że Twoje skany są wysokiej jakości, zwiększ kontrast między tekstem a tłem. Dlaczego to ważne? Ponieważ dokumenty o niskim kontraście mogą dawać słabe wyniki OCR. Zwiększając kontrast, OCR może łatwiej odróżnić tekst od tła. Jeśli fragmenty tekstu wyblakły, można je później skorygować.
Czy niektóre skany są trochę „krzywe”? Dla większości programów OCR nie będzie to problemem, ponieważ radzą sobie z niewielkim przechyleniem i zniekształceniami. Gdy dostępna jest opcja „deskew”, koniecznie użyj jej dla swojego pliku.
Czas przekonwertować skany lub obrazy na tekst
Teraz, gdy znasz wszystkie niezbędne czynniki, możesz rozpocząć wyodrębnianie tekstu. Dziś pokażemy Ci dwie różne opcje, z których możesz skorzystać przy wyodrębnianiu tekstu z obrazu lub skanu za pomocą OCR.
Konwertuj na TXT
TXT to prosty format. Zawiera wyłącznie zwykły tekst. Bez formatowania i bez obrazów. Jeśli chcesz wyodrębnić tekst ze skanu lub obrazu, to najlepsza opcja. Dodatkowo pliki są małe i można je otworzyć w każdym edytorze tekstu.
Konwertuj na Word
Konwersja tekstu do DOCX lub DOC jest idealna dla użytkowników Microsoft Word. Zaleta dokumentów Word? Operacja OCR spróbuje jak najlepiej zachować formatowanie oryginału. Jeśli grafiki lub obrazy są częścią skanu lub obrazu, dotyczy to również ich. Aby uzyskać najlepsze wyniki, wybierz wszystkie języki, jakie zawiera plik.
PORADA: OCR2Edit - Konwertuj na Word: Podczas konwersji obrazów lub skanów do jednego z formatów używanych przez edytor tekstu Microsoft Word (DOC, DOCX), w Ustawieniach OCR:
- Wybierz OCR wybierz metodę (Układ lub Rozpoznawanie tekstu).
- Wybierz język swojego pliku aby poprawić działanie OCR.
- Zaznacz pole - Popraw OCR w ustawieniach opcjonalnych, aby poprawić rozpoznawanie OCR (zamiana tekstu na monochromatyczny).