HJ hj chạy máy công ty lại ngon không hiểu nổi, nhưng tất cả lại thành 1 dòng xế, mình cần 700 dòng như cũ, các dòng cũ được phân tách thôi. Hj hj xin lỗi tại giải thích không rõ nên bạn hiểu nhầm cho thành 1 dòng lớn. Mà chương trình chạy được với file này thôi hay chạy được tổng quát với các file khác nữa ???
Máy 409 tách đẹp thế, ah mà đừng tách xuống dòng cho mình "vẫn ghi liền là 1 dòng, dùng để ngăn cách" thôi chứ không phải chèn xuống dòng luôn. Kết quả máy nhà tớ: http://www.megaupload.com/?d=VFCP4YEU
HIc chương trình chạy nhưng file tạo thành được nhận định là UCS-2 Indian, làm mất hết cả chữ nghĩa (chuyển sang ngôn ngữ mán). Có thể cho dạng UTF-8 không ?? Ô trắng bên cạnh gần với số ký tự là chi thế ??
File đó đây, http://www.megaupload.com/?d=86TUGABR 1> Tham số xác định bởi GUI của chương trình, nếu không thì theo kiểu tham số dòng lệnh từ CMD cũng được 2> Tham số không thay đổi cùng 1 lần tách, tuy nhiên để các từ không bị cắt thì dòng 1 10 chữ, dòng 2 12 chữ oKie 3> Các dòng đã tách sẵn thì giữ nguyên, nhưng chắc khó xảy ra trường hợp này Với T thì được coi là 1 từ, thì được coi là chữ. Nếu được cho mình thêm tham số là cứ được coi là 1 chữ hay được coi là 1 chữ.
Hj hj có ngay thôi, http://www.megaupload.com/?d=L4YELQQ7, tách ra nhiều dòng (nhưng vẫn ghi liền là 1 dòng, dùng để ngăn cách), trong đó số chữ trong mỗi dòng được xác định bởi một tham số, và khi ngắt dòng đảm bảo không cắt đôi chữ. Sau đó kết quả trả về thành 1 file. Hơn nữa trong dòng muốn ngắt có thể có các mã thì cứ 1 được tính là 1 ký tự, và nhóm (có thể từ 2-xx ) được coi là 1 từ không ngắt giữa chừng, 409 xem nhé. Nếu chương trình này xong có thể áp dụng cho nhiều thứ hj hj
http://javascript.about.com/library/blspline.htm Đây là ví dụ đơn giản tách câu trên java, tiếc là tớ không tìm được source trên VB6. Vụ tách này khó ha
Thanks nhé, nhưng cái Tach 1.2 có thể sửa để kết quả EN và VN không có số thứ tự ở đầu câu được không ?? Ccậu rảnh xem có giúp tớ vụ này được không. Tớ đang add Bio tướng RTK, tớ có 1 file có 700 dòng text muốn ngắt mỗi dòng thành nhiều dòng text (nhưng vẫn ghi liền là 1 dòng, dùng để ngăn cách), trong đó số chữ trong mỗi dòng được xác định bởi một tham số, và khi ngắt dòng đảm bảo không cắt đôi chữ. Sau đó kết quả trả về thành 1 file. Hơn nữa trong dòng muốn ngắt có thể có các mã thì cứ 1 được tính là 1 ký tự. 409 xem có cách nào giúp mình không ? Thief đã viết 1 CT dạng gần tương tự ở http://forum.gamevn.com/attachment.php?attachmentid=110253&d=1253358846, nhưng tớ không biết lập trình nên ko biết sửa sao cho phù hợp với mình
Đồng hương, đồng khói ở HN vì HN giờ rộng qué. Có thể giúp tớ bỏ qua nó để tránh lệch cặp câu, và lưu lại số bị lỗi vào Error.txt không ???
Hi 409, cái All 1.1 đã chạy, nhưng kết quả khá lạ khi bên bên JA là 203228 dòng, còn En lại là 203233. Tớ chạy mấy lần kết quả cũng vậy không rõ tại sao. Mà cái TachchuoiXML có thể cải thiện để nhận xử lý được nhiều file cùng một lúc không, giờ cứ phải dưới 500 file. 409 có ở Hn không để hôm nào rủ đi nhậu
Được thôi cứ nâng cấp cho tớ mấy chương trình đó chạy ngon đi, rồi hướng dẫn chơi ngay. Nhất là cái Xư lý chuỗi file all.txt, thử trên mấy máy đều bị treo hết chắc tại 23MB lớn quá chăng
Vì dân lập trình bây giờ hay xài C++, hay C# để dễ chôm code free xuống hj hj, vậy chắc phải gọi là anh rùi vì hơn tớ 2t hu hu... tưởng già nhất Gamevn rồi chứ
Giờ mới để ý, 409 xài VB6 tức là tuổi cũng kha khá rồi chắc bằng mình hj hj, ko bít là bao nhiêu cái xuân xa rồi
Cám ơn 409 nhé, với All.txt thì chắc tại file những 23MB nên chương trình ngất treo ngược luôn, với XML thì chạy tốt với khoảng 500 file trở xuống, nhiều hơn cũng ngất. Nhưng thế là quá tốt rồi, hj hj
Ah, bạn lên từ Green lên đến Novice ấy mà chưa thấy khang khác là phải thôi =)) Đã chai mặt làm phiền giờ làm phiền thêm chút. Xem hộ tớ phần Nhật - Anh này, chú giải trong file đính kèm, http://www.megaupload.com/?d=WY6U2N91
SHOCK nặng, không những không có tên file ở Error.txt, mà còn chạy được trên máy tính trước không thể chạy được một lúc hơn 800 file, lại còn không có lỗi chữ. Chúc mừng 409, bạn đã lên lv mới. Cám ơn nhiều về sự nhiệt tình của bạn. Hj hj còn rảnh không để nhờ típ hj hj
Tớ nhận được thông báo Có vấn đề gì chăng, rồi cố bấm OK mỏi chuột, kiểm tra file kết quả thấy có <sentence id="11"> ~~~> NOT FOUND! và lỗi chữ vẫn còn, để tý thử trên máy cơ quan xem sao. Ngữ liệu của tớ có cả trích từ game nhưng ít, chủ yếu để tham khảo khi dịch theo dạng fuzzy
Ngữ liệu có nhiều lắm và có nhiều loại nữa cơ, hj hj nếu 409 quan tâm tớ gửi cho lun. Đang có thêm đống ngữ liệu Nhật - Anh đang định nhờ 409 mần giúp nữa hj hj
Hic hic thử trên 6,7 máy cuối cùng có máy chạy ngon lành, nhưng yếu quá chỉ chạy 20 file một mới không bị treo máy, xong khi chạy lại 20 đầu tiên trong mục LP1 thì lại có khoảng chục cặp câu có <sentence id="xx">, http://www.megaupload.com/?d=VYFL5B0K. Hic hic chắc tại số không có duyên với đống ngữ liệu này