1. Giới thiệu
Trong những năm gần đây, với sự bùng nổ của các phương tiện truyền thông xã hội, có một nhu cầu rất lớn từ các thương hiệu và các ngành công nghiệp về việc phân tích ý kiến của khách hàng về sản phẩm của họ một cách tự động để họ có thể biết người tiêu dùng cảm nhận sản phẩm của họ cũng như những đối thủ cạnh tranh của họ như thế nào. Thông tin này không chỉ hữu ích cho việc tiếp thị và đánh giá / xếp hạng sản phẩm mà cũng hữu ích cho việc thiết kế và phát triển sản phẩm [Liu, 2008].
Trích xuất ý kiến hoặc tâm lý từ văn bản có thể được định nghĩa là phân tích tâm lý hoặc khai thác ý kiến. Đây là bài toán có đầu vào là các văn bản thô về các thương hiệu hay sản phẩm và đưa ra những thông tin tâm lý, trong đó trình bày các ý kiến của tác giả, các bình luận, đánh giá về một thương hiệu, sản phẩm cụ thể, hoặc về các tính năng / thuộc tính của sản phẩm đó. Thông thường, ta cần phải xác định xem thông tin tâm lý đó là tích cực, tiêu cực hay trung tính.
Trong khi các nghiên cứu về lĩnh vực này trong tiếng Anh đã và đang được phát triển mạnh mẽ, có rất ít nghiên cứu được áp dụng cho tiếng Việt. Điều này đã thúc đẩy chúng tôi xây dựng một hệ thống phân tích tâm lý đối với các văn bản tiếng Việt.
2. Nghiên cứu
Chúng tôi đang tập trung vào hai mức độ phân tích tâm lý: (1) mức câu, và (2) mức thực thể và khía cạnh. Nhiệm vụ phân tích ở mức câu là xác định xem mỗi câu bày tỏ một quan điểm tích cực, tiêu cực hay trung tính. Tuy nhiên, các phân tích ở mức câu không phải lúc nào cũng tìm được chính xác những gì mọi người thực sự thích hay không thích, đó là động lực cho nhiệm vụ phân tích tâm lý ở mức thực thể. Nhiệm vụ ở mức này là xác định tâm lý của một quan điểm xác định – một thực thể hoặc một khía cạnh cụ thể của thực thể đó, ví dụ như chất lượng cuộc gọi hay thời lượng pin của iPhone. Người dùng cuối, chẳng hạn như nhà phân tích tiếp thị của một thương hiệu, có thể sử dụng kết quả đó cho tất cả các loại phân tích định tính và định lượng.
Tham khảo:
[1] Bing Liu, Sentiment Analysis and Opinion Mining. 2012