Saturday, December 27, 2014

Optical Character ยอมรับ (OCR)

Optical Character ยอมรับ (OCR)

1 - เมื่อสแกนเนอร์อ่านภาพเอกสารจะแปลงองค์ประกอบมืด - ข้อความและชิ้นส่วนกราฟิก - หน้า
ในบิตแมป (บิตแมป), array ของตารางพิกเซลที่สามารถใช้งาน (สีดำ) หรือไม่ใช้งาน (สีขาว) เช่น
พิกเซลมีขนาดใหญ่กว่ามากที่สุดของรายละเอียดของข้อความกระบวนการนี​​้ degrades ปลายทินเนอร์ของตัวละคร,
เกิดขึ้นในขณะที่เครื่องแฟกซ์ การย่อยสลายจะสร้างส่วนใหญ่ของปัญหาสำหรับระบบการรับรู้แสง
Character ยอมรับ (OCR)

2 - โปรแกรม OCR อ่านบิตแมปที่สร้างขึ้นโดยสแกนเนอร์และตรวจสอบพื้นที่ของพิกเซลที่ใช้งานและไม่ได้ใช้งานของหน้าในความเป็นจริง
แผนที่มันหน้าว่าง นี้จะช่วยให้บล็อกโปรแกรมย่อหน้าแยกคอลัมน์หลักทรัพย์
และชิ้นส่วนกราฟิก พื้นที่สีขาวระหว่างบรรทัดของข้อความที่อยู่ในบล็อกกำหนดฐานของแต่ละบรรทัดรายละเอียด
ที่จำเป็นสำหรับการรับรู้ของตัวอักษรในข้อความ

3 - ในขั้นตอนแรกของการแปลงภาพเป็นข้อความที่โปรแกรมพยายามที่จะรู้จักตัวละครแต่ละตัวผ่านการเปรียบเทียบ
พิกเซลพิกเซลกับรูปแบบของตัวอักษรที่โปรแกรมที่เก็บไว้ในหน่วยความจำ รูปแบบจะประกอบด้วยชุดสมบูรณ์
- ตัวอักษรตัวเลขเครื่องหมายวรรคตอนและการขยาย - แหล่งที่มาทั่วไปเช่น Courier 12 คะแนนและชุดของไอบีเอ็ม Selectric
ตั้งแต่เทคนิคนี้จำเป็นต้องมีการแข่งขันอย่างใกล้ชิดตัวละครลักษณะเช่นตัวหนาและตัวเอียงควร
ได้รับการยอมรับให้เป็นเหมือนกัน สแกนจากผลลัพธ์ที่น่าสงสารไม่ได้คุณภาพที่ดีในแง่นี้

4 - ตัวอักษรที่ไม่รู้จักผ่านกระบวนการทั่วถึงมากขึ้นและใช้เวลานานหร​​ือที่เรียกว่าการสกัดทรัพยากร
โปรแกรมคำนวณ x ความสูงของตัวอักษร - เมื่อความสูงของตัวอักษร x ตัวพิมพ์เล็ก - และตรวจสอบการรวมกันของเส้นตรงแต่ละ
เส้นโค้งและพื้นที่ที่เต็มไปของตัวละครแต่ละตัวเช่นเดียวกับในกรณีของตัวอักษรหรือข โปรแกรม OCR รู้ตัวอย่างเช่น
ตัวละครที่มีลงต่ำกว่าเส้นฐานและเหนือพื้นที่ที่เต็มไปมีแนวโน้มมากที่สุดที่จะเป็น
เล็ก ๆ กรัม เป็นโปรแกรมเตรียมความพร้อมตัวอักษรของการทำงานของแต่ละตัวละครใหม่พบว่าความเร็วในการรับรู้
เพิ่มขึ้น

5 - วิธีการทั้งสองกระบวนการในท้ายที่สุดก็ไม่ได้แปลความหมายทุกตัวอักษรโปรแกรม OCR ใช้สองวิธีที่จะรับรู้
สัญลักษณ์ที่เหลือ บางโปรแกรม OCR ทำเครื่องหมายตัวอักษรที่ไม่รู้จักที่มีอักขระพิเศษ - เป็น ~
# หรือ @ - และออกจาก มันเป็นสิ่งจำเป็นแล้วที่จะใช้โปรแกรมประมวลผลคำที่จะค้นหาตัวอักษรพิเศษเช่น
การแก้ไขด้วยตนเอง บางโปรแกรม OCR สามารถที่จะแสดงบิตแมปในซูมบนหน้าจอและถามว่าจะเป็น
กดปุ่มที่สอดคล้องกับตัวละครในคำถามซึ่งควรถูกแทนที่ด้วยบิตแมป

6 - โปรแกรม OCR อื่น ๆ นอกจากนี้ยังขอให้ตรวจสอบการสะกดพิเศษเพื่อมองหาข้อผิดพลาดที่เห็นได้ชัดและค้นหา
ทางเลือกที่เป็นไปได้สำหรับคำที่มีตัวอักษรพิเศษไม่ได้รับรู้ ตัวอย่างเช่นโปรแกรมสำหรับ
เลขอักษร OCR ที่ 1 และ l จะคล้ายกันมากในลักษณะเดียวกับที่ห้าและ S หรือ CL และ d คำเช่น
ปรับตัวให้ชินกับสภาพแวดล้อมใหม่อาจกลายเป็น adimatar ตรวจสอบการสะกดตระหนักถึงข้อผิดพลาดเหล่านี้ OCR ทั่วไปและแก้ไขพวกเขา

7 - ส่วนใหญ่โปรแกรม dc OCR ช่วยให้การแปลงเอกสารที่เขียนใน ASCII หรือในรูปแบบที่เป็นไปได้
ได้รับการยอมรับโดยโปรแกรมประมวลผลคำและสเปรดชีตที่รู้จักมากขึ้น


No comments:

Post a Comment