第2课 问君文本何所似:词的向量表示Word2Vec和Embedding

咖哥和小冰正准备开始今天的课程,有人走进数据科学讲习所。来人是老朋友,马总。

马总:咖哥,小雪。忙呢?

咖哥:马总,你来得正好,我们正要讲一个NLP的基础知识——词向量(Word Vector),你有兴趣的话不妨一块来听听。不过,你刚才认错人了,这位是小冰。小雪最近在外边做项目。

马总:对不起,对不起,是我的错,她俩长得太像了。

马总把小冰看成小雪

小冰:哪儿像了?我怎么一点不觉得。

咖哥:马总把你看成小雪,肯定是你俩有相似之处,你想想,马总怎么没把我看成小雪呢?

小冰:你是男的,我是女的,怎么可能认错?

咖哥:对啊。这就还是说明你们俩在某些维度上的特征有相似之处,比如说,性别相同,年龄相似,而且都挺可爱……

小冰:……