Độ đo phong cách

  1. Giới thiệu
    Với sự phát triển lớn mạnh của công nghệ hiện tại, con người ngày càng có nhiều cơ hội để tăng vốn tri thức cho chính mình. Qua đó, ngày càng nhiều các văn bản được xuất hiện rất đa dạng dưới các hình thức phong cách khác nhau. Những năm gần đây, một số nhóm khoa học đã bắt đầu các nghiên cứu nhằm đưa ra các thống kê về phong cách viết cá nhân.
    Độ đo phong cách là dạng phân tích định lượng nhằm nắm bắt bản chất trong phong cách viết của một tác giả cụ thể [1], chẳng hạn như cách sử dụng ký hiệu, ký số, độ phong phú của từ vựng, v.v. Ứng dụng của độ đo phong cách rất đa dạng và ngày càng phát triển, có thể kể tới như: việc kiểm tra văn bản thuộc tác giả nào, quá trình điều tra khám nghiệm, hay thu thập thông tin về tác giả trong văn bản,… Từ một thí nghiệm thực tế, David Robinson đã thu nhập các bài tweet của Donald Trump và dùng nó để xác định bài tweet nào là thật do chính ông ấy viết hay do nhân viên của ông ấy.
    Nhiệm vụ của độ đo phong cách có thể được chia thành 05 dạng:

    • Quy gán tác giả
    • Xác nhận tác giả
    • Lập hồ sơ tác giả
    • Đo phong cách theo thời gian
    • Biến hóa phong cách
    Nhận thấy các nghiên cứu về độ đo phong cách tại Việt Nam vẫn còn là một lĩnh vực mới và chưa nhận được sự quan tâm thỏa đáng, chúng tôi đã bắt đầu tổ chức nghiên cứu, thực nghiệm các phương pháp thống kê ở các cấp độ: ký tự, từ, cú pháp,…
  2. Nghiên cứu
    Hiện nay, chúng tôi đang nghiên cứu 03 nhiêm vụ đầu tiên trong số các nhiệm vụ đã nêu trên của độ phong cách, đó là: quy gán tác giả, xác nhận tác giả và lập hồ sơ tác giả.
    Đối với nhiệm vụ lập hồ sơ tác giả, chúng tôi cũng nghiên cứu sâu về sự khác biệt giữa nam và nữ trong phong cách viết cá nhân[2]. Đây là một chủ đề đã và đang nhận được rất nhiều sự quan tâm trên toàn thế giới.
Tham khảo:

[1] Mouton de Gruyter, “Corpus Linguistics”, Chapter 50
[2] Nhung Nguyen Tuyet, Duc Do Tran Anh, Dien Dinh, “Độ đo phong cách của văn bản tiếng Việt và ứng dụng”, 2017