课程主页: https://www.coursera.org/learn/generative-ai-llm-architecture-data-preparation
课程概述
最近,我参加了 Coursera 上的一门短期课程,名为《生成式人工智能与大语言模型:架构与数据准备》。这是 IBM 提供的课程,是《生成式人工智能工程基础证书》的一部分。这门课程非常适合现有及有志于成为数据科学家、机器学习工程师、深度学习工程师和人工智能工程师的学习者。
在这个课程中,我们将学习生成式人工智能的基础知识以及大型语言模型(LLMs)的使用。课程的内容非常丰富,以下是我对每个模块的总结。
课程大纲
生成式AI架构
在这个模块中,我们了解到生成式人工智能模型的重要性,以及它们如何在广泛的领域中生成各种类型的内容。课程讲解了常见的生成式 AI 架构和模型,并阐明了这些模型的不同训练方法。同时,我们还学习了大型语言模型(LLMs)在自然语言处理(NLP)应用程序中的应用。最令人兴奋的是,我们通过 Hugging Face 的 transformers 库构建了一个简单的聊天机器人。
数据准备与 LLMs
这个模块关注数据为训练大型语言模型(LLMs)做好准备,尤其是实施分词(tokenization)。我们学习了分词的方法及其使用,同时也了解到数据加载器的目的,以及如何使用 PyTorch 中的 DataLoader 类。课程中还介绍了如何使用 nltk、spaCy、BertTokenizer 和 XLNetTokenizer等多种库实施分词,并创建了一个带有处理文本批次的合并函数的数据加载器。
我的评价与推荐
整体而言,这门课程内容系统且实用,尤其适合希望深入了解生成式人工智能及其应用的技术人员。课程中的案例项目,如聊天机器人的构建,不仅增强了我的动手能力,还加深了我对理论知识的理解。
如果你是一名对生成式人工智能感兴趣的从业者,或者想要提升自己的数据处理能力,我强烈推荐这门课程。它将是你在人工智能领域继续深造与发展的基石。
课程主页: https://www.coursera.org/learn/generative-ai-llm-architecture-data-preparation