Công cụ

  1. CLC_VN_WS

    Công cụ tách từ tiếng Việt

    • Sử dụng mô hình huấn luyện để tách từ
    • Tách từ cho toàn bộ tập tin
    • Sử dụng YamCha
    • Độ chính xác cao
  2. CLC_VN_POS

    Công cụ gán nhãn từ loại tiếng Việt

    • Sử dụng mô hình huấn luyện để gán nhãn từ loại
    • Gán nhãn POS cho toàn bộ tập tin
    • Sử dụng YamCha
    • Độ chính xác cao
  3. CLC_VN_NER

    Công cụ gán nhãn NE tiếng Việt

    • Sử dụng mô hình huấn luyện để gán nhãn NE
    • Gán nhãn NE cho toàn bộ tập tin
    • Sử dụng YamCha
    • Độ chính xác cao
  4. CLC_VN_Toolkit

    Công cụ chuẩn hóa tập tin, tách câu, tách từ, gán nhãn từ loại, gán nhãn NE tiếng Việt

    • Chuẩn hóa tập tin (dấu câu, i-y, dấu thanh, unicode dựng sẵn)
    • Tách câu
    • Tách từ
    • Gán nhán từ loại
    • Gán nhãn NE
    • Sử dụng mô hình huấn luyện để gán nhãn
    • Gán nhãn cho tất cả tập tin trong thư mục
    • Sử dụng YamCha
    • Độ chính xác cao