读文章可识人心
新华网布宜诺斯艾利斯8月13日电(记者叶书宏 赵燕燕)阿根廷研究人员最近开发出一种基于西班牙语的人工智能程序,可通过分析一个人所写的文章评估作者的人格与个性。
这套分析系统名为“人格洞察力”,可以分析被测试者的微博、论坛帖子、社交网站的评论或者公开演讲,然后与心理学模型所提供的100个参数进行相关度比对,从而描绘被测试者的人格特征,比如社交倾向、乐观倾向、自信程度、价值取向等。
让机器辨析人性确实不是件容易的事,关键是构建足够可信的关联数据库。阿根廷研究人员解释说,心理学家通过大量实证研究积累了丰富的关于特定人格与所用词汇和表达方式相关性的数据库,并在此基础上构建了词汇与人格倾向的分析模型。
研究发现,最适合用于评估人性的文章来自“情绪化写作”,例如微博、博客、跟帖评论或演讲文稿,作者所用词汇与人格分析模型词汇库的相关度非常高,最不适合的是学术文章,通过一篇关于宇宙起源的学术论文做人格评估自然不会得出理想的结果。
评估系统在其网站上分析了美国前总统肯尼迪的一篇演讲稿,得出结论是:“多数时候您非常自信,很少自责,很严肃,善于控制欲望,另外您的欲望并不是很强烈,您有哲学思维,接受新思想,喜欢探索,抉择时名誉是考虑的决定因素……”
当然这篇1394个单词的演讲稿长度有限,研究团队推荐的文字长度最少是3500字。研究人员认为,为了得到更加可靠的评估结果,6000字左右最为适合。
如果把最不适合人格评估的学术类文章输入评估系统会怎样呢?系统评估了斯蒂芬·霍金《时间简史》第一章节第一段,结果也颇为有趣:或许是情绪化用语太少的缘故,“想象力”和“开放度”分值高达90%,而“对爱的需求”却为零。