课程主页: https://www.coursera.org/learn/natural-language-processing-tensorflow
课程概述
如果你是一名软件开发者,想要构建可扩展的AI驱动算法,你需要了解如何使用工具来构建它们。这门专业化课程将教你使用TensorFlow——一个流行的开源机器学习框架的最佳实践。
在deeplearning.ai的TensorFlow专业化课程的第三部分中,你将学习如何使用TensorFlow构建自然语言处理系统。你将学习如何处理文本,包括将句子进行标记化并表示为向量,以便进行训练和分析。
课程大纲
文本中的情感分析
理解文本中的情感,尤其是在训练神经网络时,第一步是对文本进行标记化。这一过程将文本转换为数值,用数字表示单词或字符。本周,你将学习如何使用TensorFlow中的Tokenizer和pad_sequences API来准备和编码文本,使其为训练神经网络做好准备。
词嵌入
在上一周,你见识了如何使用Tokenizer准备文本,以便网络可以使用,将单词转换为数值令牌,并利用这些令牌进行序列化。这个星期,你将学习词嵌入(Embeddings),这些令牌将在高维空间中映射为向量。通过词嵌入和带标签的示例,这些向量可以调优,使得具有相似意义的单词在向量空间中具有相似的方向。这样,你将开始训练神经网络以理解文本中的情感,特别是开始分析电影评论,并根据正面或负面的标签训练网络,确定句子中哪些单词驱动了这些含义。
序列模型
在过去的几周,你首先学习了如何将单词标记化,以从中获得数值,然后使用词嵌入来根据标签分组具有相似意义的单词。此时你得到了一个良好但粗略的情感分析。但情感也可以通过单词的出现顺序来确立。例如,“not fun”显然与“fun”相反。本周你将开始深入研究各种模型格式,这些格式用于训练模型以理解序列中的上下文!
序列模型与文学
综合你在基于NLP训练神经网络方面学到的一切,本周我们将把重心转向预测。给定一段文本,你将能预测出最有可能跟随某个单词或短语的单词,并且可以重复这一过程。为了实现这一目标,本周你将构建一个诗歌生成器,它以传统爱尔兰歌曲的歌词进行训练,进而能生成优美的诗句!
课程主页: https://www.coursera.org/learn/natural-language-processing-tensorflow