เปรียบเทียบเอกสารอัตโนมัติด้วย Computer Vision

การตรวจสอบสัญญาฉบับยาวเพื่อหาการแก้ไขด้วยลายมือที่ไม่ได้รับอนุญาตเป็นกระบวนการที่น่าเบื่อและเกิดข้อผิดพลาดได้ง่าย ลองนึกภาพการตรวจสอบเอกสาร 50 หน้า ทีละบรรทัด เพื่อหาลายปากกาที่แทบมองไม่เห็น นี่เป็นความท้าทายที่แท้จริงสำหรับบริษัทที่ดำเนินการตามสัญญาที่ซับซ้อน ซึ่งแม้แต่การแก้ไขเล็กน้อยก็อาจส่งผลกระทบทางกฎหมายอย่างมีนัยสำคัญ เวิร์กโฟลว์ลายเซ็นดิจิทัลแบบดั้งเดิมสามารถจัดการได้ในกรณีส่วนใหญ่ แต่ข้อตกลงที่ซับซ้อนเหล่านี้ ซึ่งมักจะเจรจากันเป็นเดือนๆ จำเป็นต้องมีกระบวนการพิมพ์-เซ็น-สแกนที่ยุ่งยาก ทำให้มีโอกาสเกิดการเปลี่ยนแปลงที่ไม่ตั้งใจ

ความต้องการที่สำคัญคือการตรวจสอบให้แน่ใจว่าสัญญาฉบับยาวเหล่านี้ยังคงไม่เปลี่ยนแปลงหลังจากการตรวจสอบและลงนามโดยลูกค้า คำถามเกิดขึ้น: จะสามารถทำให้การตรวจสอบด้วยสายตาที่ลำบากนี้เป็นแบบอัตโนมัติได้อย่างไร เพื่อขจัดข้อผิดพลาดของมนุษย์และประหยัดเวลาอันมีค่า

คำตอบอยู่ที่การใช้ประโยชน์จากพลังของ Computer Vision โดยเฉพาะอย่างยิ่งกับเครื่องมือต่างๆ เช่น Intelligence Suite ชุดเครื่องมือนี้มีชุดบล็อกการสร้างที่ออกแบบมาเพื่อโต้ตอบกับเอกสารที่เป็นรูปภาพ เช่น PDF, JPEG และ PNG ช่วยให้สามารถปรับปรุงภาพได้ด้วยการจัดตำแหน่ง การครอบตัด และการลดสัญญาณรบกวน ที่สำคัญกว่านั้นคือ ให้ความสามารถในการดึงข้อมูล การนำเทมเพลตไปใช้เพื่อการจดจำข้อความ และแม้แต่การประมวลผลบาร์โค้ดและคิวอาร์โค้ด นอกจากนี้ คุณยังสามารถฝึกฝนแบบจำลองการจดจำภาพเพื่อจำแนกภาพใหม่ตามรูปแบบที่เรียนรู้ได้

✔️ พร้อมปฏิวัติการประมวลผลเอกสารของคุณแล้วหรือยัง? สำรวจ Intelligence Suite Trial และเริ่มต้นใช้งาน Starter Kit วันนี้!

ภาพรวมของเวิร์กโฟลว์ Computer Vision สำหรับการเปรียบเทียบเอกสาร โดยเน้นขั้นตอนที่เกี่ยวข้องในการทำให้กระบวนการตรวจสอบเป็นแบบอัตโนมัติ

เวิร์กโฟลว์อัตโนมัติสำหรับการเปรียบเทียบเอกสาร

วัตถุประสงค์คือการสร้างเวิร์กโฟลว์ที่คล่องตัวซึ่งสามารถเปรียบเทียบเอกสารต้นฉบับกับฉบับแก้ไข โดยเฉพาะอย่างยิ่งการระบุหน้าที่มีการทำเครื่องหมายด้วยลายมือ เวิร์กโฟลว์ที่ออกแบบมาจะสร้างรายงานที่แยกเฉพาะหน้าเหล่านั้นที่มีการทำเครื่องหมายว่าอาจมีการแก้ไข แทนที่จะตรวจสอบสัญญาทั้ง 50 หน้าด้วยตนเอง ลองนึกภาพการได้รับรายงานที่กระชับซึ่งเน้นเพียงสองหรือสามหน้าที่ต้องให้ความสนใจมากขึ้น ซึ่งเป็นการก้าวกระโดดครั้งสำคัญในด้านประสิทธิภาพ

แผนภาพโดยละเอียดที่แสดงเวิร์กโฟลว์อัตโนมัติสำหรับการเปรียบเทียบเอกสารและการตรวจจับการทำเครื่องหมายด้วยลายมือ ตั้งแต่การป้อนข้อมูลไปจนถึงการสร้างรายงาน

ข้อมูลตัวอย่าง: ข้อตกลงสิทธิ์การใช้งานสำหรับผู้ใช้ปลายทาง (EULA)

เพื่อสาธิตเวิร์กโฟลว์นี้ด้วยข้อมูลที่เข้าถึงได้แบบสาธารณะ จึงได้เลือกข้อตกลงสิทธิ์การใช้งานสำหรับผู้ใช้ปลายทาง (EULA) ของ Alteryx Designer เอกสาร 6 หน้าถูกดาวน์โหลดจาก URL นี้ และบันทึกเป็นไฟล์ PDF ที่ชื่อว่า Original Alteryx EULA v20 2006.pdf

เพื่อจำลองสัญญาที่แก้ไขแล้ว EULA ได้ถูกพิมพ์ และมีการเพิ่มเครื่องหมายด้วยลายมือด้วยหมึกสีแดงในหน้า 3 และ 4 จากนั้นเอกสารที่ทำเครื่องหมายไว้จะถูกสแกนและบันทึกเป็น Signed Alteryx EULA with Markups.pdf (มีให้ที่ส่วนท้ายของบทความต้นฉบับ) แม้ว่าจะเรียกว่า “ลงนามแล้ว” แต่สิ่งสำคัญคือต้องทราบว่า EULA นี้ไม่มีหน้าลงนาม ลองนึกภาพว่าเป็นส่วนที่เป็นตัวแทนของสัญญาขนาดใหญ่ก่อนหน้าส่วนลงนาม การสำรวจแยกต่างหากในอนาคตจะเน้นไปที่การทำให้การตรวจจับลายเซ็นเป็นแบบอัตโนมัติ สำหรับตัวอย่างนี้ เอกสาร “ต้นฉบับ” และ “ลงนามแล้ว” แสดงถึงหน้าก่อนหน้าลงนาม

ประเด็นสำคัญของการตั้งค่าข้อมูลคือการมีไฟล์ PDF สองไฟล์ที่แตกต่างกัน แต่ละไฟล์มีจำนวนหน้าเท่ากันเรียงตามลำดับเดียวกัน ซึ่งแสดงถึงเอกสารต้นฉบับและเอกสารที่อาจมีการแก้ไข

นี่คือการเปรียบเทียบภาพของหน้า 3 โดยแสดงเอกสารต้นฉบับทางด้านซ้ายและฉบับที่มีการทำเครื่องหมายทางด้านขวา:

การเปรียบเทียบแบบเคียงข้างกันของหน้า 3 จาก EULA ต้นฉบับ (ซ้าย) และ EULA ที่มีการทำเครื่องหมายด้วยลายมือ (ขวา) ซึ่งแสดงให้เห็นถึงการเปลี่ยนแปลงที่เกิดขึ้นอย่างชัดเจน

ผลลัพธ์ของเวิร์กโฟลว์: การระบุหน้าที่มีการแก้ไข

เมื่อดำเนินการเวิร์กโฟลว์และตรวจสอบผลลัพธ์สุดท้าย ผลลัพธ์จะแสดงหน้า 3 และ 4 อย่างชัดเจน ทั้งฉบับต้นฉบับและฉบับที่มีการทำเครื่องหมายแบบเคียงข้างกันเพื่อให้ง่ายต่อการเปรียบเทียบ

ผลลัพธ์ของเวิร์กโฟลว์ที่แสดงหน้า 3 ของทั้งเอกสารต้นฉบับและเอกสารที่มีการทำเครื่องหมายแบบเคียงข้างกัน โดยเน้นความแตกต่างที่ตรวจพบ

ผลลัพธ์ของเวิร์กโฟลว์ที่แสดงหน้า 4 ซึ่งแสดงให้เห็นถึงการตรวจพบแม้แต่การเปลี่ยนแปลงด้วยลายมือเล็กน้อย เช่น การเพิ่มคำว่า “not”

ที่น่าสังเกตคือ หน้า 4 มีการเปลี่ยนแปลงเพียงเล็กน้อย คือ การแทรกคำว่า “not” เวิร์กโฟลว์สามารถระบุการเปลี่ยนแปลงเล็กน้อยนี้ได้สำเร็จ ซึ่งแสดงให้เห็นถึงความแม่นยำ

ขั้นตอนต่อไปนี้สรุปกระบวนการในการระบุหน้าที่มีการทำเครื่องหมายด้วยลายมือ

ขั้นตอนที่ 1 – การป้อนข้อมูลด้วยเครื่องมือ Image Input

กระบวนการเริ่มต้นด้วยเครื่องมือ Image Input ซึ่งช่วยให้คุณสามารถระบุโฟลเดอร์ที่มีทั้งไฟล์ PDF ต้นฉบับและไฟล์ที่แก้ไขแล้ว เวิร์กโฟลว์นี้ออกแบบมาเพื่อประมวลผลไฟล์สองไฟล์ในแต่ละครั้ง ตรวจสอบให้แน่ใจว่ามีเฉพาะคู่ของเอกสารที่คุณต้องการเปรียบเทียบอยู่ในโฟลเดอร์ที่กำหนด เครื่องมือ Image Input ใช้เทคโนโลยีการรู้จำอักขระด้วยแสง (OCR) โดยถือว่าแต่ละหน้าใน PDF เป็นภาพเดี่ยว

การกำหนดค่าของเครื่องมือ Image Input ซึ่งแสดงวิธีการระบุโฟลเดอร์ที่มีไฟล์ PDF สำหรับการเปรียบเทียบเอกสาร

ขั้นตอนที่ 2 – การประมวลผลภาพเบื้องต้น: การแปลงเป็นขาวดำ

แม้ว่าการทำเครื่องหมายจะทำด้วยหมึกสีแดงโดยเจตนา แต่การแปลงภาพเป็นขาวดำจะช่วยเพิ่มความน่าเชื่อถือของเวิร์กโฟลว์ เครื่องมือ Image Processing ช่วยอำนวยความสะดวกในการแปลงนี้

การกำหนดค่าของเครื่องมือ Image Processing แสดงขั้นตอนในการแปลงภาพสีเป็นขาวดำเพื่อปรับปรุงความแม่นยำในการตรวจจับการทำเครื่องหมาย

การแปลงเป็นขาวดำที่ดีที่สุดเกี่ยวข้องกับลำดับการดำเนินการสามอย่างภายในเครื่องมือ Image Processing:

  • การปรับสมดุลความสว่าง: การตั้งค่า Brightness Balance เป็น -77 จะทำให้ข้อความเข้มขึ้น ซึ่งช่วยปรับปรุงความคมชัด ค่านี้อาจต้องปรับขึ้นอยู่กับลักษณะของเอกสาร แต่โดยทั่วไปค่าลบจะทำให้ภาพเข้มขึ้น
  • การแปลงระดับสีเทา: ฟังก์ชัน Grayscale จะแปลงภาพสีเป็นเฉดสีเทา ซึ่งเป็นขั้นตอนกลางที่จำเป็นสำหรับการแปลงเป็นขาวดำ
  • การกำหนดเกณฑ์ไบนารี: การกำหนดเกณฑ์ภาพไบนารีจะลดพิกเซลและสัญญาณรบกวนที่หลงเหลือ โดยเฉพาะอย่างยิ่งเป็นประโยชน์ในการลดเงาหรือสิ่งประดิษฐ์ที่เกิดขึ้นระหว่างกระบวนการสแกน ขั้นตอนนี้ใช้เทคนิค การกำหนดเกณฑ์ภาพ

ขั้นตอนโดยละเอียดภายในเครื่องมือ Image Processing: Brightness Balance, การแปลงระดับสีเทา และการกำหนดเกณฑ์ไบนารี ซึ่งแสดงให้เห็นถึงกระบวนการปรับปรุงภาพ

ขั้นตอนที่ 3 – การสร้างโปรไฟล์ภาพและการจัดเรียงหน้า

ถัดไป เครื่องมือ Image Profile จะถูกใช้เพื่อดึงข้อมูลเมตาจากภาพที่ประมวลผลแล้ว เพิ่มฟิลด์อธิบาย จากนั้นหน้าต่างๆ จะถูกจัดเรียงแบบเคียงข้างกัน และรายการที่ซ้ำกันจะถูกลบออกผ่านขั้นตอนต่อๆ ไป ฟิลด์ “Test” ชั่วคราวจะถูกสร้างขึ้นและลบออกในภายหลังระหว่างขั้นตอนนี้

การแสดงภาพของส่วนเวิร์กโฟลว์ที่เกี่ยวข้องกับการสร้างโปรไฟล์ภาพและการจัดเรียงหน้า แสดงเครื่องมือที่ใช้ในการจัดระเบียบและเตรียมข้อมูลสำหรับการเปรียบเทียบ

หลังจากขั้นตอน Image Input และ Image Processing ซึ่งสร้างฟิลด์ [image] และ [image_processed] แล้ว เครื่องมือ Image Profile จะถูกนำไปใช้กับฟิลด์ [image_processed] ตามค่าเริ่มต้น Image Profile ถูกกำหนดค่าเป็น “เลือกทั้งหมด” โปรไฟล์ข้อมูลเมตา อย่างไรก็ตาม สำหรับเวิร์กโฟลว์นี้ เฉพาะจำนวนพิกเซลสว่างเท่านั้นที่เกี่ยวข้อง ดังนั้น การกำหนดค่าจึงเปลี่ยนเป็น “รวมเฉพาะโปรไฟล์ที่เลือก” และเลือกชุด “ฐาน” จากรายการแบบเลื่อนลง

เครื่องมือ การกำหนดค่า

ไอคอนเครื่องมือ Image Profile และแผงการกำหนดค่า แสดงการเลือกโปรไฟล์ข้อมูลเมตา “ฐาน” เพื่อดึงข้อมูลจำนวนพิกเซลสว่าง

เครื่องมือ Image Profile สร้างฟิลด์ข้อมูลเมตาจำนวนมาก (17 ในกรณีนีี้) จากนั้นเครื่องมือ Select จะถูกใช้เพื่อเก็บเฉพาะฟิลด์ [Bright_Pixel_Count] และละทิ้งส่วนที่เหลือ พร้อมกับการเปลี่ยนชื่อและปรับขนาดบางส่วนเพื่อความชัดเจนและประสิทธิภาพ

ฟิลด์ที่เก็บไว้คือ:

  • file (ปรับขนาดเป็น 100 อักขระ)
  • page (เปลี่ยนชื่อเป็น Page)
  • image (เปลี่ยนชื่อเป็น Original Image)
  • Bright_Pixel_Count

การปรับขนาดฟิลด์ [file] เป็นแนวทางปฏิบัติที่ดีที่สุดสำหรับการจัดการข้อมูล การเปลี่ยนชื่อ [page] เป็น [Page] และ [image] เป็น [Original Image] ช่วยเพิ่มความสอดคล้องกันของชื่อฟิลด์เพื่อปรับปรุงความสามารถในการอ่านและการบำรุงรักษาเวิร์กโฟลว์

การแปลงที่สำคัญในขั้นตอนนี้คือการปรับโครงสร้างข้อมูลจากรายการเดียวที่มีหน้าทั้งหมดจากไฟล์ PDF ทั้งสองเป็นรายการรวม รายการนี้ควรมีหนึ่งแถวต่อหน้า โดยมีฟิลด์ภาพและจำนวนพิกเซลที่สอดคล้องกันจากทั้งเอกสารต้นฉบับและเอกสารที่ลงนามแล้วจัดตำแหน่งในแถวเดียวกัน

โครงสร้างข้อมูลเริ่มต้นมีลักษณะดังนี้:

ตัวอย่างของโครงสร้างข้อมูลเริ่มต้นหลังจากการสร้างโปรไฟล์ภาพ แสดงแถวแยกต่างหากสำหรับแต่ละหน้าจากทั้งเอกสารต้นฉบับและเอกสารที่ลงนามแล้ว

โครงสร้างข้อมูลที่ต้องการสำหรับการเปรียบเทียบคือ:

โครงสร้างข้อมูลที่ต้องการหลังจากการรวมและการกรอง โดยแต่ละแถวแสดงถึงหน้าหนึ่งและมีข้อมูลจากทั้งเอกสารต้นฉบับและเอกสารที่ลงนามแล้วเพื่อการเปรียบเทียบโดยตรง

เพื่อให้บรรลุการปรับโครงสร้างนี้ เครื่องมือ Join จะถูกใช้เพื่อรวมข้อมูลเข้ากับตัวเองตามฟิลด์ [Page] ไม่ได้เลือกช่องทำเครื่องหมายถัดจาก [Page] จากอินพุตการรวมทางขวาเพื่อหลีกเลี่ยงฟิลด์หน้าซ้ำกัน

เครื่องมือ การกำหนดค่า

ไอคอนและการกำหนดค่าเครื่องมือ Join แสดงการรวมตัวเองตามฟิลด์ “Page” เพื่อรวมข้อมูลจากเอกสารต้นฉบับและเอกสารที่ลงนามแล้ว

การรวมชุดข้อมูลเอกสาร 6 หน้าเข้ากับตัวเองส่งผลให้มี 24 แถว (4 ชุดค่าผสม 6 หน้าต่อชุด) ชุดค่าผสมเหล่านี้แสดงถึง:

ไฟล์ 1 ไฟล์ 2
สัญญาต้นฉบับ สัญญาต้นฉบับ
สัญญาที่ลงนามแล้ว สัญญาที่ลงนามแล้ว
สัญญาต้นฉบับ สัญญาที่ลงนามแล้ว
สัญญาที่ลงนามแล้ว สัญญาต้นฉบับ

จากนั้นเครื่องมือ Filter จะถูกใช้เพื่อกำจัดแถวที่ทั้ง [File 1] และ [File 2] อ้างอิงไฟล์เดียวกัน (สองชุดค่าผสมแรกในตารางด้านบน)

เครื่องมือ การกำหนดค่า

การกำหนดค่าของเครื่องมือ Filter ใช้เพื่อลบแถวที่ซ้ำซ้อนที่อินพุตไฟล์ทั้งสองเหมือนกัน เหลือเฉพาะแถวที่มีเอกสารต้นฉบับและเอกสารที่ลงนามแล้วที่จับคู่กัน

การกรองนี้จะลดชุดข้อมูลเหลือ 12 ระเบียน

ผลลัพธ์ข้อมูลที่กรองแล้ว แสดง 12 ระเบียนที่มีหน้าเอกสารต้นฉบับและเอกสารที่ลงนามแล้วที่จับคู่กัน พร้อมสำหรับการลบข้อมูลที่ซ้ำกัน

เมื่อตรวจสอบอย่างใกล้ชิด แต่ละหน้าจะมีสองระเบียนที่เหมือนกัน ตัวอย่างเช่น ระเบียน 1 และ 2 ทั้งคู่แสดงถึงหน้า 4 โดยไฟล์ต้นฉบับและไฟล์ที่ลงนามแล้วสลับตำแหน่งระหว่าง [File 1] และ [File 2], [File 1 Original Image] และ [File 2 Original Image] และ [File 1 Bright Pixel Count] และ [File 2 Bright Pixel Count] เพื่อแก้ไขความซ้ำซ้อนนี้ จำเป็นต้องลบหนึ่งแถวจากแต่ละคู่ secara konsisten

เพื่อให้แน่ใจว่าการลบข้อมูลที่ซ้ำกันอย่างสม่ำเสมอ เครื่องมือ Sort จะถูกนำไปใช้ โดยการเรียงลำดับข้อมูลตาม [Page] แล้วตามด้วย [File 1] แม้ว่าข้อมูลอาจปรากฏตามลำดับแล้ว แต่ขั้นตอนนี้ช่วยให้มั่นใจได้ว่าการเรียงลำดับจะสอดคล้องกันแม้ว่าจะมีข้อมูลอินพุตที่แตกต่างกันในอนาคต

เครื่องมือ การกำหนดค่า

การกำหนดค่าของเครื่องมือ Sort การเรียงลำดับข้อมูลตาม “Page” และ “File 1” เพื่อเตรียมการสำหรับการลบข้อมูลที่ซ้ำกันโดยใช้เครื่องมือ Unique

สุดท้าย เครื่องมือ Unique จะถูกใช้เพื่อเก็บเฉพาะแถวเฉพาะแรกสำหรับแต่ละ [Page] ซึ่งจะลบระเบียนที่ซ้ำกันอย่างมีประสิทธิภาพ

เครื่องมือ การกำหนดค่า

ไอคอนและการกำหนดค่าเครื่องมือ Unique ตั้งค่าเพื่อระบุแถวเฉพาะตามฟิลด์ “Page” การลบระเบียนที่ซ้ำกันและส่งผลให้มีหนึ่งแถวต่อหน้า

กระบวนการนี้ส่งผลให้ชุดข้อมูลมีหนึ่งแถวต่อหน้า แต่ละแถวมีชื่อไฟล์ ภาพ และจำนวนพิกเซลสว่างของไฟล์ต้นฉบับและไฟล์ที่ลงนามแล้ว พร้อมสำหรับขั้นตอนการตรวจจับการทำเครื่องหมาย

ขั้นตอนที่ 4 – การตรวจจับการทำเครื่องหมายและการกรองหน้า

ขั้นตอนที่สำคัญคือการทดสอบการทำเครื่องหมายโดยการคำนวณอัตราส่วนตามจำนวนพิกเซลสว่างและการใช้เกณฑ์เพื่อระบุหน้าที่มีแนวโน้มว่าจะมีการแก้ไขด้วยลายมือ หน้าที่เกินเกณฑ์นี้จะถูกตั้งค่าสถานะสำหรับการตรวจสอบด้วยตนเอง

การแสดงภาพของส่วนเวิร์กโฟลว์สำหรับการตรวจจับการทำเครื่องหมาย แสดงเครื่องมือ Formula และ Filter ที่ใช้ในการระบุหน้าที่มีการเปลี่ยนแปลงด้วยลายมือ

อัตราส่วนคำนวณดังนี้: ผลต่างสัมบูรณ์ของจำนวนพิกเซลสว่างระหว่างสองหน้าหารด้วยจำนวนพิกเซลสว่างที่น้อยกว่าของทั้งสอง การทำให้เป็นมาตรฐานนี้เป็นสิ่งจำเป็นเพื่อพิจารณาความผันแปรที่อาจเกิดขึ้นในขนาดภาพหรือคุณภาพการสแกนระหว่างเอกสารต้นฉบับและเอกสารที่ลงนามแล้ว

เครื่องมือ การกำหนดค่า

ไอคอนและการกำหนดค่าเครื่องมือ Formula แสดงสูตรที่ใช้ในการคำนวณอัตราส่วนการทำเครื่องหมายตามจำนวนพิกเซลสว่าง

การใช้อัตราส่วน แทนที่จะเป็นความแตกต่างของจำนวนพิกเซลดิบ เป็นสิ่งสำคัญ ความผันแปรของขนาดภาพระหว่างสัญญาต้นฉบับ (ซึ่งน่าจะพิมพ์แบบดิจิทัล) และสัญญาที่ลงนามแล้ว (พิมพ์และสแกน) อาจนำไปสู่ความแตกต่างของจำนวนพิกเซลที่สำคัญซึ่งไม่เกี่ยวข้องกับการทำเครื่องหมาย อัตราส่วนทำให้ความแตกต่างของขนาดนี้เป็นปกติ ป้องกันไม่ให้ภาพที่มีขนาดใหญ่กว่าอย่างไม่สมส่วนบิดเบือนการเปรียบเทียบ

จากนั้นเครื่องมือ Formula อีกตัวหนึ่งจะสร้างฟิลด์ [Test for Markups] โดยกำหนดป้ายกำกับข้อความตามอัตราส่วนที่คำนวณได้ หน้าที่เกินเกณฑ์ (พิจารณาเชิงประจักษ์ว่าเป็น 0.046 สำหรับเอกสารนี้) จะถูกตั้งค่าสถานะเป็น “Markup likely here” ในขณะที่หน้าอื่นๆ จะถูกระบุว่า “No markups here”

เครื่องมือ การกำหนดค่า

ไอคอนและการกำหนดค่าเครื่องมือ Formula แสดงสูตรเงื่อนไขที่ใช้ในการกำหนดป้ายกำกับ “Markup likely here” หรือ “No markups here” ตามอัตราส่วนและเกณฑ์ที่คำนวณได้

ตามที่คาดไว้ หน้า 3 และ 4 ซึ่งมีการทำเครื่องหมายในสัญญาที่ลงนามแล้ว จะถูกระบุอย่างถูกต้อง เกณฑ์ 0.046 แยกแยะหน้าที่มีและไม่มีการทำเครื่องหมายสำหรับเอกสารเฉพาะนี้อย่างมีประสิทธิภาพ

สุดท้าย เครื่องมือ Filter พื้นฐานจะถูกใช้เพื่อแยกเฉพาะหน้าที่ [Test for Markups] ไม่เท่ากับ “No markups here” เหลือเฉพาะหน้าที่ตั้งค่าสถานะว่ามีแนวโน้มว่าจะมีการทำเครื่องหมาย

เครื่องมือ การกำหนดค่า

ไอคอนและการกำหนดค่าเครื่องมือ Filter ตั้งค่าเพื่อกรองข้อมูลและส่งออกเฉพาะแถวที่ระบุว่า “Markup likely here” การแยกหน้าที่มีการแก้ไขด้วยลายมือที่อาจเกิดขึ้น

เวิร์กโฟลว์ประสบความสำเร็จในการแยกหน้า 3 และ 4 ซึ่งเป็นหน้าที่มีการทำเครื่องหมายด้วยลายมือ ซึ่งแสดงให้เห็นถึงประสิทธิภาพของวิธีการตาม Computer Vision นี้

เวิร์กโฟลว์นี้จัดเตรียมโซลูชันอัตโนมัติสำหรับปัญหาที่เคยทำด้วยตนเองและใช้เวลานาน ความสามารถในการระบุหน้าที่มีการทำเครื่องหมายด้วยลายมือในสัญญาโดยอัตโนมัติช่วยปรับปรุงกระบวนการตรวจสอบอย่างมีนัยสำคัญ ประหยัดเวลาและลดความเสี่ยงในการมองข้ามการเปลี่ยนแปลงที่สำคัญ

ในขณะที่ส่วนนี้ของเวิร์กโฟลว์จัดเตรียมฟังก์ชันหลัก รูปแบบเอาต์พุตเป็นแบบพื้นฐาน ส่วนที่ 2 ของการสำรวจนี้จะเน้นที่การปรับปรุงการนำเสนอผลลัพธ์เหล่านี้ สร้างรายงานที่ดึงดูดสายตาและให้ข้อมูล ติดตามตอนที่ 2 ในสัปดาห์หน้าเพื่อดูวิธีทำให้ผลลัพธ์เหล่านี้พร้อมสำหรับการนำเสนอ

ค้นหาหน้าสัญญาที่มีการทำเครื่องหมาย.yxmd

Comments

No comments yet. Why don’t you start the discussion?

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *