作文概括

  1. 介绍
    近年来,随着因特网的发展,网上的信息也不断爆炸。如果没有自动总结的解法的话,这样超大的信息让我们难以完整地接受与开采。过去的几个世纪,自动总结的趋势不仅在学习和研究领域中而且在工业领域中也越来越受欢迎,雅虎和谷歌把两家公司在新闻总结的领域起业收购,分为是Summly 和 Wavii.
    关于越南语的作文总结研究目前还是有限。研究主要的是使用摘出方法:从一些作文上选出词语,词组或者句子,进行总结。CLC的目的就是寻找总结版跟人类的做法最相似:新总结作文以摘出原文的信息而造成,同时,新文含有新词语而原文没有。
  2. 研究
    我们主要集中自动总结作文的3部分:多作文总结,混合句子和压缩句子。
    • 多作文总结是新文以总结同一个题目或者事件的原文而造成。
    • 混合句子是从很多相同句子而造成新一个总和句子。
    • 压缩句子是以从原文中删除不需要的词语或者词组而造成一个正确语法的新句子。