被尬聊击伤之后 浙大工科男发力了!



转载请注明 AIQ - 最专业的机器学习大数据社区  http://www.6aiq.com

AIQ 机器学习大数据 知乎专栏 点击关注

10dd4c402db24f8885dc5394eb978bb7-image.png

* 一段网上流传的尬聊截屏 *

1995 年出生的浙江大学计算机科学与技术学院大四学生焦云皓, 因一次出言不慎, 在微信上被同窗了 16 年的好友拉黑, 友谊的小船说翻就翻。

他由此想到两个问题:什么人是聊天终结者?怎样对话能避免尬聊?

工科男解决问题的方式是: 用大数据说话, 让人工智能想办法。

焦云皓开发出一套 ConverNet 人工智能系统, 它在分析一段对话后能作出判断: 这一段聊天, 是否要终结了。这套 AI 系统还通过大数据驱动的深度学习方法告诉人类: 什么样的语言和聊天方式, 有被冠上“尬聊”的风险。

而这项研究的相关论文《找到对话终结者: 一个终结聊天回复预测模型的研究》, 已被互联网领域的高水平国际会议——国际万维网大会 (简称 WWW 会议) 录用。

本月 22 日, 焦云皓将赴会议举办地法国里昂, 向学界分享他的研究成果。

AI 自学 10 万组对话

总结聊天是怎么聊死的

焦云皓研究的是社交网络上的聊天,“人们在网络上聊天, 会更加自由, 一旦觉得没意思了, 或者不愉快了, 就不再理会。”

他的 ConverNet 系统, 能不厌其烦地“自学”一组一组对话, 洞悉人类聊天过程中的细枝末节, 学得越多, 它就越智能。

在合作导师、美国密歇根大学计算机学院终身教授梅俏竹老师的指点下, 焦云皓找到了两个公开的海量数据库, 让系统开始“刷题”。

焦云皓说,ConverNe 这次学习的都是英文文本。相比中文, 英文的语法容易一些, 单词量也少一些, 人工智能容易分析。“当然, 英语语境下的很多尬聊情境, 和中文聊天有相似之处, 所以一些基本原则, 对我们讲中文的人来说, 也可以借鉴。”

“社交网络上的聊天, 主要分群聊和单聊, 这两种都会出现尬聊, 但是情况是不一样的。一个数据库类似于中国的‘知乎’, 很多人围绕一个话题讨论并且能够相互点评, 接近于社交媒体中的群聊模式; 而另一个提供的是海量的电影里的对白, 接近于单聊。”焦云皓开发的人工智能, 对这两种场景都进行了分析。

ConverNet 花了半小时, 自学了共 10 万组对话。“通过这半小时的学习,ConverNet 自行掌握了一些聊天终结者的特点, 接下来, 它就可以随机对一组新的对话是否存在终结隐患进行预判。”焦云皓说。

经过海量“自学”之后,ConverNet 选择了一个数据库进行自我测试, 成绩不错——它的预测准确率达到 80% 左右, 各项指标也优于传统方法。

大段大段的发言

群聊会冷场, 单聊受欢迎

今年 2 月 8 日下午 3 点多, 焦云皓的微信“叮咚”一响, 一个集合了 402 名北美校友的朋友群里, 一位校友发来一条“重型猎鹰火箭发射成功”的消息。

紧随其后的, 还是这位校友——从“马斯克发射火箭的壮举”, 到火箭上装载的一辆特斯拉上播放大卫·鲍伊的音乐, 从车里有一本《银河系漫游指南》, 到对人类未来的畅想, 洋洋洒洒 273 个字, 像写了一篇热情澎湃的小作文。

可惜的是, 从这条消息发出之后的两天里, 这个 400 多人的大群里, 无一回复, 表情也没有一个。

这正是人工智能分析出的典型“聊天终结者”表现之一: 在群聊场合, 简短的句子更受欢迎。如果某人突然说了一大段的发言, 后面易出现冷场的状况。

“群聊中, 没有特别针对性的情况下, 大家一般都不会看完这么长的一段发言, 不看那也就没有什么可回复的了。”焦云皓说,“日常生活需要高效的聊天。微信里, 大家说话一般比较简短, 才容易接下去, 你一言我一语。”

焦云皓的老爸, 也是儿子这项研究的受益者之一。以前, 他在微信的各种聊天群中, 也爱大段大段地发言, 这在一堆短句当中显得格格不入。

“老爸看完论文, 微信上发长篇大论比以前少了许多, 改发表情包, 发短句子, 真的不像以前那么容易冷场了。”

但是 ConverNet 同时分析出来, 群聊里, 发长文不受待见, 但在个聊时, 情况正相反。所以另外一条建议是: 单聊场合, 句子越长, 谈话越可能持续, 因为双方能够进行深度的交流。

知乎上有个帖子, 叫“把天聊死, 是一种怎样的体验”, 最有人气的回复是这样一段: 哥哥弟弟坡前坐, 坡上坐着一只鹅, 坡下流着一条河, 哥哥说:“宽宽的河”, 弟弟说:“嗯”。

在一对一的聊天中,“嗯”“哦”这种回答,“杀死”一场聊天事小, 可能“杀”出一条单身狗来——女孩子最不喜欢男朋友这样的回应。

最后, 焦云皓总结出一些避免成为对话终结者的要义: 内容不跑题, 快速作回复, 阐述要详细, 情绪要积极, 并注意你的语气, 文字表达不到的地方, 多用表情包。

焦云皓的本科设计指导老师、计算机学院吴飞教授认为, 焦云皓的研究关注到之前没有人关注到的有趣现象, 并尝试用人工智能的方式去解答, 很有价值。“希望将来有人能够进一步改进我们提出的方法, 或者等这个系统学习到更海量的数据, 会变得越来越聪明。”

可以期待的是, 将来, 人们聊天时会有一个智能聊天助手, 当你出语不妥,AI 会弹出一条提示送你“给你一次重新组织语言的机会”。

正如焦云皓所说, 如果这个聊天助手早点出现, 说不定他就不会被同学拉黑了。那次他带着同学玩过“王者荣耀”后说:“就你这水平, 换作其他人, 我才不带他玩呢。”结果, 他被拉黑了, 后来虽然又加回好友, 但再也没一起玩过王者荣耀。

ConverNet的小总结:怎样会把天聊死

1、 分享。 当对话中出现 heard(我听说),seen(我看到过) 等词语时, 聊天易持续长久, 这些词汇体现了分享的愿望; 而当出现 Christ(天呐),but(但是),ass(屁) 等词语时, 聊天终结的概率会明显增大。

2、 回合。 在单聊场合, 聊天的回合越多, 越可能终止对话; 而在群聊过程中, 回合越多代表话题越热烈, 越有可能持续。

3、 时间。 如果你发起对话时间在诸如深夜、清晨等休息时间, 容易引起对方反感, 也有可能造成尬聊。

4、 情绪。 群聊中, 负面情绪有可能会引发新一轮的共鸣与探讨, 但在单聊中, 负面情绪可能会倾向于终结对话。


更多高质资源 尽在AIQ 机器学习大数据 知乎专栏 点击关注

转载请注明 AIQ - 最专业的机器学习大数据社区  http://www.6aiq.com