机器摘出文章大意可行吗?继Summly之后,美15岁高中生又做了Clipped
还记得我们网站报道过的Summly吗?它是一款提取文章摘要的应用,适用于我们信息爆炸时代的快餐消费。听着很炫,不过它做的工作很基础,就是把文章开头作为摘要提取出来,没有什么技术含量,不能完全满足我们的阅读需求。而最近一个15岁美国高中生弄出了一套摘要提取算法(据说他还在为这套算法申请专利),试图做到真正的“摘要提取“功能,以真正满足用户快速阅读的需求。这套算法现已被实现在一个叫做Clipped的应用中。
摘要提取是否准确关系到你这个应用是在玩个噱头,还是在真正想成为用户阅读的习惯性入口。Summly就只是玩个噱头。我体验过后发现它基本上就是把文章的前面部分截取为摘要,但事实上很多文章的开头只是个引子,光读这个根本搞不清文章在说什么,不能判定这篇文章是标题党,还是真正有料。总之,Summly不太实用,这联他们的创始人都承认,说Summly不会让用户上瘾。
Clipped至少有一套相对复杂的摘要提取算法。它会为每篇文章提取主要的三个观点,清晰的罗列出来。我体验过后发现,一些比较偏重事实的文章,确实读Clipped提出的三点摘要就能大概了解文章内容了,而一些偏重观点性的文章,Clipped还是提的不是很好。观点比事实藏的深是一大难题。不管怎样,对于一个15岁的高中生,算是做了一件很有想法的事。
最后提醒大家,不要对两款应用的用户体验要求过高,否则你会气死,毕竟Summly是一个小伙辍学组建的一个小团队做的,而Clipped就是一个15岁高中生自己做的。不过这个想法很有意思,希望国内创业者能够为我们做个真正实用的,这样我的阅读效率会提高很多。
另外,这事还可换个角度考虑。Clipped是”摘出法“,摘出文章关键的几句话以过滤一些没料的文章。但如果文章有料我们还是要点进去看。事实上,我们还可以采取”删除法“,删繁就简,去粗取精。这样有料的文章我们就不用点进去了。但是,单单机器算法就能提高阅读效率吗?我始终认为必须机器和人工有机结合,才能真正起到提高我们阅读效率的作用。