Semua topik yang

+
Home > Sumber > PDF > pengetahuan pengecaman aksara optik (OCR)

Pengetahuan dalam pengecaman aksara optik (OCR)

Apakah OCR

Pengecaman aksara optik, biasanya disingkatkan kepada OCR, adalah terjemahan kerosakan mekanikal atau elektronik imej yang telah diimbas teks tulisan tangan, typewritten atau dicetak ke dalam teks Mesin-dikodkan.

Mengapa menggunakan OCR?

OCR digunakan secara meluas untuk menukar jenis dokumen, seperti kertas yang diimbas dokumen, fail PDF atau imej-imej yang ditangkap oleh kamera digital ke dalam data boleh diedit dan dicari. Dalam sesetengah persekitaran profesional (seperti Perpustakaan, Pejabat), beribu-ribu buku-buku dan dokumen-dokumen akan diimbas secara kerap untuk sandaran dan Arkib. Pengimbas semata-mata mengambil gambar-gambar dokumen kertas asal yang mengakibatkan berasaskan imej imbasan dokumen dalam PDF format. Isu utama dengan pemprosesan dan penyimpanan tersebut bialngan besar imbasan dokumen adalah ketidakupayaan untuk mencari frasa tertentu atau nama di dalam fail. Juga tiada teks boleh diketengahkan, disalin, atau diubahsuai, kerana dokumen tersebut mengandungi satu fail imej besar berbanding watak-watak individu teks.

OCR Sample

Sebelum melaksanakan OCR, keseluruhan kawasan halaman yang dipilih dan diketengahkan dan teks tidak dapat dicari dan diedit.

Selepas melaksanakan OCR, teks pada halaman boleh dipilih dengan memilih alat, anda boleh Cari dan edit huruf, perkataan dan perenggan dengan mudah.

Bagaimana alat PDF OCR Wondershare lakukan membantu anda?

Alat-alat PDF OCR Wondershare boleh membantu anda mengenali teks dari PDF imbasan cepat dan tepat dan mengekalkan hasil yang diiktiraf dalam pelbagai format yang boleh diedit.

Wondershare PDF Editor Pro for Mac: dengan cemerlang OCR ketepatan dan format pemeliharaan, membolehkan anda untuk mencari, membetulkan dan Salin teks dalam PDF imbasan atau berasaskan imej secara langsung pada Mac. Ia juga membolehkan anda untuk mengeksport diimbas PDF format teks berasaskan Word, Excel, PowerPoint, EPUB, HTML, dan format teks.

Wondershare PDF Converter Pro: mengenali teks dari PDF diimbas dengan ketepatan OCR yang cemerlang dan boleh menukar PDF imbasan berbilang berasaskan teks Word, Excel, PowerPoint, EPUB, HTML, dan teks dokumen pada Windows.


Wondershare PDF Converter Pro for Mac: mengenali teks dari PDF diimbas dengan ketepatan OCR yang cemerlang dan boleh menukar PDF imbasan berbilang berasaskan teks Word, Excel, PowerPoint, EPUB, HTML, dan teks dokumen pada Mac.

Bagaimana untuk meningkatkan OCR pengiktirafan Kualiti?

OCR pengiktirafan Kualiti bergantung sebahagian besarnya pada kualiti imej, yang sangat bergantung pada tetapan yang digunakan semasa proses mengimbas dokumen itu. Untuk mendapatkan kualiti OCR pengiktirafan yang lebih baik bagi dokumen imbasan anda, berikut adalah beberapa tips untuk mengimbas dokumen:

Font adalah terlalu kecil
Untuk hasil optimum pengiktirafan, mengimbas dokumen-dokumen yang dicetak dalam fon yang amat kecil pada resolusi yang lebih tinggi.
Anda boleh menentukan resolusi dikehendaki resolusi harta objek ScanSourceSettings .


Sumber imej Resolusi yang dicadangkan
Reader 300 dpi bagi teks biasa (dicetak dalam fon bersaiz 10 pt atau lebih besar)
Reader 400-600 dpi bagi teks dicetak dalam fon lebih kecil (9pt atau lebih kecil)

Penalaan kecerahan
Anda mungkin perlu mengubah pengesetan kecerahan semasa mengimbas dalam mod hitam dan putih. Anda boleh menentukan kecerahan dikehendaki harta kecerahan objek ScanSourceSettings . Nilai sederhana kira-kira 50% harus mencukupi dalam kebanyakan kes.
Jika imej terhasil mengandungi terlalu banyak "terkoyak" atau "terjebak" bersama-sama Surat-surat, menyelesaikan masalah menggunakan Jadual di bawah.

Imej anda kelihatan seperti ini Cadangan-cadangan
Good Quality Imej ini amat sesuai untuk pengiktirafan
Very Light
watak-watak akan "koyak" atau sangat ringan
  • Mengurangkan kecerahan agar imej yang gelap.
  • Imbas dalam grayscale. Kecerahan akan ditala secara automatik.
  • Very Dark
    watak-watak akan diputarbelitkan, piring, atau mengisi
  • Peningkatan kecerahan agar imej lebih cerah
  • Imbas dalam grayscale. Kecerahan akan ditala secara automatik.
  • Kualiti cetakan
    Miskin-kualiti dokumen dengan "bunyi" (iaitu rawak titik hitam atau speckles), Surat-surat yang kabur dan tidak sekata, atau menyebelahi mereka garisan dan sempadan Jadual beralih mungkin memerlukan seting imbasan yang tertentu. Sebagai contoh, ini Faks dan akhbar:

    Print Quality

    Dokumen miskin-kualiti terbaik diimbas dalam grayscale. Semasa mengimbas dalam grayscale, program ini akan memilih nilai kecerahan yang optimum secara automatik.
    Mod Grayscale mengekalkan maklumat lanjut mengenai huruf-huruf di dalam teks yang diimbas untuk mencapai Pengiktirafan hasil yang lebih baik apabila mengenali dokumen yang sederhana berkualiti rendah.


    Artikel yang berkaitan

    Soalan berkaitan produk? Bercakap secara langsung dengan pasukan sokongan kami >>

    Atas