Hỏi về tự động hóa n8n và AI, OCR

Thảo luận trong 'Thư giãn' bắt đầu bởi Bộ kiểm soát chính tả, 24/9/25 lúc 14:43.

  1. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,471
    Chào các bác, lâu rồi mới lên GVN. Hôm nay mình muốn nhờ anh em góp ý về việc cải thiện quy trình sản xuất tại công ty.

    Công ty mình làm trong lĩnh vực xây dựng, chủ yếu là thiết kế và tính toán. Hiện nay bọn mình vẫn làm thủ công khá nhiều: nhập số liệu vào Excel, chạy các phần mềm, soạn báo cáo Word, v.v. Trong quá trình làm việc ai cũng thấy có rất nhiều công việc lặp lại, tốn thời gian. Vì vậy mình đang định hướng sang tự động hóa quy trình, kết hợp AI và OCR để giảm tải khâu văn phòng.

    Mình có tìm hiểu thì thấy n8n là công cụ tự động hóa khá mạnh, thư viện nhiều. Nhưng còn nhiều chỗ chưa rõ, mong anh em tư vấn:

    1. Nhập dữ liệu từ PDF sang Excel/Word:
      • Với PDF chứa text thì việc trích xuất ra sao?

      • Nhưng nếu PDF chỉ là ảnh thì phải dùng OCR. Mình muốn hỏi: quy trình hợp lý để tự động nhập dữ liệu từ PDF (cả text lẫn ảnh) sang bảng tính là gì? Có cách nào huấn luyện AI đọc hiểu tài liệu rồi tự động điền số liệu vào bảng không?
    2. Xử lý tài liệu lớn (hàng trăm trang):
      • Khi mình thử upload PDF/DOC lớn lên ChatGPT, kết quả chỉ là tóm tắt sơ lược, không trích xuất chính xác được số liệu mình cần.

      • Có AI nào mạnh hơn để đọc hiểu toàn bộ tài liệu lớn và trích xuất thông tin chuẩn xác hơn không, hay là do mình chưa biết cách dùng?
    3. OCR cho chữ viết tay:
      • Nhiều tài liệu của mình là bảng biểu viết tay (nhất là số).

      • AI OCR nào nhận dạng chữ viết tay mạnh nhất hiện nay?

      • Nếu chưa đủ tốt, có cách nào huấn luyện riêng một model để nhận dạng chữ viết tay của một số người cụ thể (ví dụ các thí nghiệm viên), rồi kết hợp với n8n để số hóa dữ liệu này không?
    4. Đọc bản vẽ kỹ thuật:
      • Có AI nào đọc hiểu được bản vẽ kỹ thuật đơn giản không? Ví dụ nhận diện nhanh phần mặt cắt, rồi xuất thông tin ra Excel?
    5. Kết nối giữa phần mềm:
      • Mình muốn viết tool kiểu “cầu nối”: ví dụ khi chụp ảnh trong AutoCAD thì hình đó tự động copy sang Excel.

      • Mình có thể viết Python, có ChatGPT hỗ trợ, nhưng chưa rõ hướng đi nào hợp lý nhất để triển khai.
    Mình không chuyên IT, mới tìm hiểu AI nên còn thấy mông lung. Mong cao nhân trong ngành chỉ giáo giúp. Xin cảm ơn anh em!
     
    Tạch...tạch...tạch... thích bài này.
  2. Hiishiro

    Hiishiro Idol Thanh Lâu GVN Berserker Tàu ngầm GVN

    Tham gia ngày:
    8/7/11
    Bài viết:
    1,967
    Nếu cty có tiền thì Lão nghiên cứu power automate của M$, trong đó có phần AI Builder chuyên việc đọc và nhặt, sàng lọc data tổng hợp.

    Còn muốn tiết kiệm chi phí thì nghiên cứu và chỉ liên quan đến tác vụ extract data từ ảnh bằng code nhà trồng thì thử con lib pytesseract của python xem.
     
  3. BrianChi

    BrianChi C O N T R A ✡ Shine Wizard ✡ Lão Làng GVN

    Tham gia ngày:
    9/4/08
    Bài viết:
    1,578
    Trước hết là ông muốn nguyên cứu nhằm mục đích gì.
    - Cải thiện năng suất lao động của bản thân.
    - Cải thiện của mức công ty?
    - Nguồn lực mà ông có là bao nhiêu tiền, có access được cloud public không

    Vì tùy theo tình trạng mới có ae vào hỗ trợ được.
     
    Bộ kiểm soát chính tả thích bài này.
  4. Hoàn Gia Sắc

    Hoàn Gia Sắc snake, snake, snaaaake Lão Làng GVN

    Tham gia ngày:
    14/9/09
    Bài viết:
    8,483
    Thuê team IT nó setup cho, phải config với viết thêm script, test độ chính xác, performance nữa. Mấy template n8n free trên mạng nhìn thì tham khảo chơi thôi chứ copy về chạy rồi sai tùm lum. Flow càng phức tạp càng dễ sai. Từ demo lên production là một quá trình dài đấy.
     
  5. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,471
    1. Mục đích là tạo quy trình tự động hóa cho toàn bộ nhân viên, để mỗi anh em đều cải thiện năng suất lao động cá nhân, và đơn giản thao tác sử dụng để ngay cả các anh em ko biết về IT cũng có thể thao tác được.
    2. Hiện tại thì bên em đã mua 1 tên miền io.vn riêng cho công ty, và có thể sử dụng n8n workflow trên đó. Kinh phí thì có thể khá nhiều (~ 1-2 tỷ) nếu em chứng mình được sự khả thi bằng 1 số sản phẩm đầu tiên. Nhưng trước mắt thì chỉ khoảng 30 triệu để thử nghiệm thôi.
     
  6. Red Mosnter

    Red Mosnter Red, Pokémon Champion ‍ ⚚ Mystic Mage ⚚ GVN Dalit

    Tham gia ngày:
    20/8/03
    Bài viết:
    45,434
    Viết giúp cái tương tự đi Tòn, chỗ anh em 1 chai bia thôi
     
  7. T1nhLaG1

    T1nhLaG1 Star swallower ♞ Blade Knight ♞ Lão Làng GVN

    Tham gia ngày:
    2/11/09
    Bài viết:
    15,517
    Hình như fen này nhật nô
     
  8. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,471
    Đi học ở Nhật thôi chứ về VN hơn 1 năm rồi mà.
     
    T1nhLaG1 thích bài này.
  9. BrianChi

    BrianChi C O N T R A ✡ Shine Wizard ✡ Lão Làng GVN

    Tham gia ngày:
    9/4/08
    Bài viết:
    1,578
    Tôi không rõ vị trí của ông trong cty ntn nhé, nhưng sẽ assumpt là mức leader hoặc có tầm ảnh hưởng để tư vấn cho đúng.
    Việc đầu tiên của ông không phải là viết tool, hoặc apply AI. Mà là tìm hiểu về các methodology về phương án triển khai AI, để biết được cần làm các step nào, thường là làm assessment user để nắm được trình độ, nhận thức của user về AI hoặc paint point collect case study của AI tại từng role, vị trí, quy trình , rồi focus cải thiện từng phần.

    Còn các vde kỹ thuật ông hỏi, thực ra nhiều lúc end-user lại không sử dụng
     
    Bộ kiểm soát chính tả thích bài này.
  10. jumper

    jumper Baldur's Gate Lão Làng GVN

    Tham gia ngày:
    5/6/03
    Bài viết:
    28,306
    1.2.
    OCR xài EasyOCR là nhanh nhất (độ chính xác cao tương đương tesserac)
    tuy nhiên bảng biểu khá ngu
    muốn bảng biểu thì xài LLM tabular riêng
    3. bỏ đi, chữ viết tay sai số cực kỳ cao

    n8n là cái công cụ automation (RPA) thôi
    cũng phải code để chạy
     
    Bộ kiểm soát chính tả thích bài này.
  11. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,471
    1. Về các methodology: Nói thật là vì chưa biết nên em mới đăng lên trên này hỏi các bác để tìm ra hướng đi đúng đắn.
    2. Về assessment user: Hiện tại các ae kỹ sư đều là người trẻ, biết cách ứng dụng công nghệ. Điểm trừ là chưa có kiến thức về tự động hóa, AI, đang quen cách làm cũ. Cũng đã khảo sát đánh giá và anh em 100% ủng hộ việc này, sẵn sàng trợ giúp cải thiện quy trình và test sản phẩm.

    Thực ra em cũng từ các công việc của anh em đang làm hiện nay mà đi lên, nên quy trình của các công đoạn thì gần như em nắm được khá rõ rồi, những gì khó khăn, cần tự động hóa thì em cũng hiểu rất rõ nên giờ đang nghĩ cách làm.
     
  12. Bộ kiểm soát chính tả

    Bộ kiểm soát chính tả Chánh tả nà cuột xống

    Tham gia ngày:
    14/5/20
    Bài viết:
    1,471
    3. Chữ viết tay thì bắt buộc rồi bác ạ. Anh em đi làm hiện trường bẩn thỉu vất vả, nhiều người còn lớn tuổi đầu óc cũng đơn giản, ko tiện dùng điện thoại với máy tính bảng để ghi chép đâu. Hơn nữa còn phải đưa Giám sát ký, nên anh em chép luôn vào biểu mẫu giấy. Nếu huấn luyện riêng biệt chữ viết tay của 1 số người thì có được ko và làm thế nào? Hay là có thể đào tạo anh em hiện trường 1 khóa để viết đẹp và rõ ràng hơn cho máy đọc ko?
     
  13. jumper

    jumper Baldur's Gate Lão Làng GVN

    Tham gia ngày:
    5/6/03
    Bài viết:
    28,306
    voice to text còn dễ hơn chữ viết tay :)))
     
  14. Hoàn Gia Sắc

    Hoàn Gia Sắc snake, snake, snaaaake Lão Làng GVN

    Tham gia ngày:
    14/9/09
    Bài viết:
    8,483
    Làm thì phải làm lớn chứ núm ka. 1 chai bia không đủ đâu !namca
     
  15. sonvn

    sonvn Mega Man Lão Làng GVN

    Tham gia ngày:
    8/8/05
    Bài viết:
    3,232
    Huấn luyện riêng biệt chữ viết tay của 1 số người khá tốn công sức mà nếu trong quá trình OCR có sai sót thì mất thời gian để đối chiếu.
    1 cách đơn giản hơn là dùng máy tính bảng (hoặc điện thoại) với form điện tử và sử dụng voice to text như bác trên tư vấn, dữ liệu được số hoá và double check từ cả người nhập và giám sát, thêm cái chữ ký số cho đạt chuẩn iso?
     
  16. Eternal Winter

    Eternal Winter C O N T R A Lão Làng GVN

    Tham gia ngày:
    4/6/09
    Bài viết:
    1,711
    Nơi ở:
    Ngõ nhỏ phố nhỏ nhà tôi ở đó
    OCR nhận diện chữ viết tay thì thôi, mình đi scan tài liệu bằng OCR nhiều đoạn nó còn k nhận chữ được cơ. Mấy bác già thì cứ viết tay xong đưa cho đám trẻ nó nhập liệu thôi. Mà các bác già này nhiều khi không thay đc vì kinh nghiệm xử lý tốt và ít cuống hơn các bạn trẻ.
     
    Tạch...tạch...tạch... thích bài này.
  17. lovelybear

    lovelybear John Marston's Redemption Lão Làng GVN

    Tham gia ngày:
    2/1/05
    Bài viết:
    21,635
    Cái số 1 dễ nè
    Mua Office 365 có tính năng xuất hết data từ pdf sang Excel / Word luôn
    Trich1 xuất chính xác luôn, thống kê lại luôn
    Cái số 2
    Làm y chang số 1, mua Office 365

    Cái 4,5:
    Mình hiểu ý bạn nhưng bạn làm vậy sai cách rồi
    Theo mình hiểu là bạn cần cái BOM trong bản vẽ xuất sang đúng ko, cái đó autoCAD + Inventor làm được rồi, bạn đi hỏi ông thiết kế, mà chắc mấy ông đó tay mơ ko biết cách, chịu khó kiếm ai biết bỏ tiền ra học đi
    Nó có sẵn, chỉ là bạn chưa biết nó tồn tại nên mới tìm kiếm AI GPT hơi lạc đề rồi

    Cái số 3 thì chữ viết tay mà, nó hên xui, nhưng có thể giảm được 80% công việc, vẫn xài như cái 1,2 mình nói ở trên nha
    Cần thiết có thể pm bàn kỹ hơn
     
    Tạch...tạch...tạch... thích bài này.
  18. BrianChi

    BrianChi C O N T R A ✡ Shine Wizard ✡ Lão Làng GVN

    Tham gia ngày:
    9/4/08
    Bài viết:
    1,578
    1. Thì hướng đi tôi nghĩ ae ở đây cũng chỉ tư vấn được đến mức cần phải làm gì đại khái, còn nếu đi như thế nào học cái gì thì phải tự mò.
    2. Các cái ông nói thì tôi cũng nghĩ là ok, nhưng mà cần phải lượng hóa được, ví dụ saving time, cost sau khi áp dụng. Thì sau này xin budget dễ hơn và đo đạc đc value của việc cải thiện.
    3. Sau bao lâu tôi làm các trò dx thì khó khăn lớn nhất k phải là kỹ thuật, mà là mình làm gì với nó, và value nó mang lại cho end user là gì
     
  19. lovelybear

    lovelybear John Marston's Redemption Lão Làng GVN

    Tham gia ngày:
    2/1/05
    Bài viết:
    21,635
    1 lon đủ không worry-100[​IMG]
     
    Hoàn Gia Sắc thích bài này.
  20. Hoàn Gia Sắc

    Hoàn Gia Sắc snake, snake, snaaaake Lão Làng GVN

    Tham gia ngày:
    14/9/09
    Bài viết:
    8,483
    Very gút
     

Chia sẻ trang này