Công cụ

 1. CLC_VN_WS

  Công cụ tách từ tiếng Việt

  • Sử dụng mô hình huấn luyện để tách từ
  • Tách từ cho toàn bộ tập tin
  • Sử dụng YamCha
  • Độ chính xác cao
 2. CLC_VN_POS

  Công cụ gán nhãn từ loại tiếng Việt

  • Sử dụng mô hình huấn luyện để gán nhãn từ loại
  • Gán nhãn POS cho toàn bộ tập tin
  • Sử dụng YamCha
  • Độ chính xác cao
 3. CLC_VN_NER

  Công cụ gán nhãn NE tiếng Việt

  • Sử dụng mô hình huấn luyện để gán nhãn NE
  • Gán nhãn NE cho toàn bộ tập tin
  • Sử dụng YamCha
  • Độ chính xác cao
 4. CLC_VN_Toolkit

  Công cụ chuẩn hóa tập tin, tách câu, tách từ, gán nhãn từ loại, gán nhãn NE tiếng Việt

  • Chuẩn hóa tập tin (dấu câu, i-y, dấu thanh, unicode dựng sẵn)
  • Tách câu
  • Tách từ
  • Gán nhán từ loại
  • Gán nhãn NE
  • Sử dụng mô hình huấn luyện để gán nhãn
  • Gán nhãn cho tất cả tập tin trong thư mục
  • Sử dụng YamCha
  • Độ chính xác cao