词典

你有没有这种感受,看到美丽的景色想要抒发感慨时,却深感力不从心、书到用时方恨少?最后分享在朋友圈的往往是九宫格图片,评论区也被“卧槽”、“666”、“真不戳”等网络热词攻占?

2019年,中国青年报社会调查中心联合问卷网对2002名受访者进行的一项调查显示,76.5%的受访者感觉自己的语言越来越贫乏。而这种现象往往也被称之为文字失语症。

提起这一词,相信大家并不陌生,今年9月1日,题为《拿什么拯救被“梗”住的“文字失语者”》的评论就曾引起广泛关注,在豆瓣,有着相同困扰的网友们集结一堂,组成“文字失语者互助联盟”。相隔数月,这个小组的人数从13.9 w发展至21.1w,网络热词让语言表达变得越来越困难,情况之严重可见一斑。

你也在为梗吃掉了语言而发愁吗?现在,和学生时代摘抄好词佳句的小本本说“拜拜”,小智向大家诚挚推荐一款修辞神器——「反向词典」!点击“阅读原文”即可体验。

帮助失语者,在行!

据悉,这款修辞神器是由清华大学自然语言处理与社会人文计算实验室和清华大学人工智能研究院合作出品。小智不由对学霸投去仰慕的眼光。

植物拉丁文在线词典发音查询_在线英语词典查询_在线词典+英语

在项目的 GitHub 页面上,研发团队给出了反向词典的定义和应用范围。顾名思义,普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。

反向词典可以用来做什么?

语言表达能力蹭蹭涨

万词王的页面设计与一般的在线翻译网站有些类似,些许不同的是,目前万词王仅支持中英文在线英语词典查询,包括以下功能:① 输入中文搜寻到中文相关的词汇 ② 输入英文搜寻到英文相关的词汇 ③ 输入中文搜寻到英文相关的词汇 ④ 输入英文搜寻到中文相关的词汇。

万词王页面设计

在线词典+英语_植物拉丁文在线词典发音查询_在线英语词典查询

进入网站,小智迫不及待地尝试了第一项功能,输入“形容不开心的词”,网页几乎没有延迟,很快给出了100个词汇,这些词汇默认按照相关性排序,看着前排的“不快”、“闷闷不乐”等词在线英语词典查询,小智刚想赞许地点点头,就发现了一些“滥竽充数”的词——好家伙,宽心、挂心、放心……这是给心开会呢!

当然,除了相关性排序,还有许多排序选项帮助你回忆起脑海中朦胧的词语,毕竟,有时候我们离正确的答案只差一步。

尝试着点击其中一个词语,出现的弹出浮窗中不仅包含词语的拼音和解释,而且还有查看义原、百度汉语、查同义词、上报错误四个按钮帮助查阅词典的用户更深入地学习词语,改善词典质量。

总体而言,万词王中文检索的结果还是比较靠谱的,那么英文检索呢?输入“形容开心的词”,得到结果如下:

在线词典+英语_植物拉丁文在线词典发音查询_在线英语词典查询

看起来这似乎是丰富英语词汇的好方法,看到英语单词,小智又想起了被abandon支配的恐惧。与中文相比,英文检索结果的干扰项似乎更多,比如小智就没看明白为什么含义为“食欲”的“savor”会出现在结果中,难道是因为吃东西会改善情绪?

揭秘反向词典的背后技术

接下来就让小智解答大家的疑问——万词王的核心模型为研发团队此前发表在AAAI-20上的一篇论文中提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model 。

万词王工作流

这些学霸表示,我们发现现有的反向字典方法无法成功地处理高变量的输入查询和低频率的目标词,于是提出多通道反向字典模型来同时解决这两个问题。

在线词典+英语_植物拉丁文在线词典发音查询_在线英语词典查询

模型的基本框架本质上类似于一种句子分类模型,由一个句子编码器和一个分类器组成。一个句子中不同的单词对句子表达的重要性不同,因此,研究团队将注意力机制整合到BiLSTM(反向词典的基本框架)中,学习更好的句子表征。

模型架构

在万词王官网的FQA中,可以看到研发团队对检索结果存在干扰项问题的诚挚回答:因为反向查词模型训练数据以及性能所限,很难避免查出不太相关甚至特别离谱的词。一方面需要大家多多对查词结果点赞或踩来帮助我们更好地训练模型,另一方面我们也会考虑优化模型和词表,提高查词精确度。

在文中提到的论文中,研究团队也指出了未来反向词典的发展方向,他们将尝试把模型与文本匹配方法相结合,以更好地处理极端情况,如单字输入查询。小智不禁欢呼,简直是懒人福音!

有了这款不断进步中的修辞神器,想必大家的语言表达能力也会蹭蹭上涨。而“副作用”嘛,则是「文化牛逼症」,比如小智现在形容祖国的大好河山时会用上:良辰美景、美不胜收、山明水秀、风光月霁……邻居家的小孩都在排队等着让我辅导作文了,还不快来体验一番!

本文来自网络,不代表佳妮英评网立场,转载请注明出处。

作者: admin