- Giới thiệu
Ngày nay, với sự phát triển mạnh mẽ của Công nghệ Thông tin, vấn đề đạo văn đang ngày càng trở nên phổ biến trong nhiều lĩnh vực của đời sống không chỉ ở Việt Nam mà trên toàn thế giới. Bên cạnh đó, các ứng dụng Xử lý Ngôn ngữ tự nhiên trong việc phát hiện đạo văn đã và đang được nghiên cứu và có nhiều cải tiến trong những năm gần đây. Tuy vậy, các phương pháp phát hiện đạo văn trong tiếng Việt mới chỉ dừng lại ở mức phát hiện các sao chép nguyên văn hoặc sao chép và có chỉnh sửa không nhiều. Hơn nữa, các công cụ phát hiện đạo văn nổi tiếng trên thế giới cũng không hiệu quả khi phát hiện đạo văn cho tiếng Việt, đặc biệt là trường hợp đạo văn theo dạng viết lại. Trong thực tế, những người vi phạm có thể đạo văn rất dễ dàng bằng cách viết lại các câu sử dụng các từ đồng nghĩa và gần nghĩa [1].
- Nghiên cứu
Nghiên cứu của chúng tôi tập trung vào các vấn đề sau:
- Xác định đạo văn dạng sao chép nguyên văn không có chỉnh sửa
- Xác định đạo văn dạng sao chép nguyên văn có chỉnh sửa
- Xác định đạo văn dạng viết lại ý
- Hướng phát triển: xác định đạo văn xuyên ngữ
Tham khảo:
[1] Nguyen Le Thanh, Toan Nguyen Xuan and Dien Dinh, “Vietnamese plagiarism detection method”, The Seventh International Symposium on Information and Communication Technology (SoICT ’16), December 08-09, 2016, Hochiminh City, Vietnam, © 2016 ACM. ISBN 978-1-4503-4815-7/16/12