-
CLC_VN_WS
Công cụ tách từ tiếng Việt
- Sử dụng mô hình huấn luyện để tách từ
- Tách từ cho toàn bộ tập tin
- Sử dụng YamCha
- Độ chính xác cao
-
CLC_VN_POS
Công cụ gán nhãn từ loại tiếng Việt
- Sử dụng mô hình huấn luyện để gán nhãn từ loại
- Gán nhãn POS cho toàn bộ tập tin
- Sử dụng YamCha
- Độ chính xác cao
-
CLC_VN_NER
Công cụ gán nhãn NE tiếng Việt
- Sử dụng mô hình huấn luyện để gán nhãn NE
- Gán nhãn NE cho toàn bộ tập tin
- Sử dụng YamCha
- Độ chính xác cao
-
CLC_VN_Toolkit
Công cụ chuẩn hóa tập tin, tách câu, tách từ, gán nhãn từ loại, gán nhãn NE tiếng Việt
- Chuẩn hóa tập tin (dấu câu, i-y, dấu thanh, unicode dựng sẵn)
- Tách câu
- Tách từ
- Gán nhán từ loại
- Gán nhãn NE
- Sử dụng mô hình huấn luyện để gán nhãn
- Gán nhãn cho tất cả tập tin trong thư mục
- Sử dụng YamCha
- Độ chính xác cao