Phố Đỗ VănXin ké chủ thớt, a e mình hỏi có web/dịch vụ nào miễn phí/trả phí để spin content tiếng anh ko vậy
Đoàn Diệucứ ghép 2, 3 từ thành 1 cụm từ rồi search trong từ diển thôi. không có thì bỏ qua
Khổng Minh CôngMình ko am hiểu thuật toán từ điển lắm nhưng về cơ bản 1 từ có thể đơn mà cũng có thể kép, rất nhiều trường hợp từ ghép cũng có nghĩa mà đơn cũng có nghĩa vì vậy phải tra cả đơn lẫn kép theo mình là vậy, đa số sẽ từ 3 chữ trở xuống nên có thêm bảng đo độ ưu tiên, khá giôg từ điển
Dinh NguyenThím viết được tool ngon thì chắc tụi viết content marketing thất nghiệp hết
Trần Minh TuấnMình có thể dùng:
-`pyvi` để tokenizer
- wordnet để replace từ đồng nghĩa
Đậu Minh ViệtThay vì duyệt đoạn text thì mình sẽ duyệt từ điển. Find key nếu tồn tại thì replace
Long P LeCái này gồm hai phần
- Tokenizer để anh tách từ, cụm từ
- wordnet hoặc goldendict, để anh tìm được value của từ anh cần chuyển sang từ đồng nghĩa, cả hai cái dict trên đều cần tự dựng server
Để làm cho ra được feature này cũng phải tầm 2-3 tháng, cả hai phần trên đều nên làm ở phía c++
Luýt Bùi))).
, i, j) nằm trong từ điển thì replace và i+=j
Thanh Bình Lêcó thể tham khảo thêm về word segmentation và wordnet ạ.