——我院举办“ChatGPT技术”云讲座
2023年5月12日,由教务处举办的“ChatGPT技术”讲座在“钉钉”平台举行。我院1500余名师生共同观看了北京邮电大学副教授张成文老师的演讲。
ChatGPT无疑是今年最具代表性的AI技术名词。什么是ChatGPT?它又能做什么?ChatGPT(Chat Generative Pre-trained Transformer)是由OpenAI公司开发的大型语言模型,它被训练用于理解和生成自然语言文本,并能够与用户进行对话。ChatGPT可以追溯到2018年发布的第一代语言模型GPT-1。2021年推出了GPT-3.5,也被称为ChatGPT,它在前代的基础上进行了改进和优化,并提高了生成文本的质量和可控性。目前针对ChatGPT-4的更新仍在持续进行中。ChatGPT具备上下文理解的能力,可实现连续对话。ChatGPT具备掌握多种任务处理的能力:它可以回答问题、撰写文章、代码调试、语言翻译,可以生成多种样式的文本,并提供时事、历史、科学等各种主题的信息,通过代码训练获得推理能力和代码生成能力。基于ChatGPT编程功能衍生出的AI绘画、音乐、剧本、视频创作也日臻成熟。
张老师认为,ChatGPT为代表的人工智能作为第四次科技革命,已经进入2.0时代。随后张老师从大模型的基本技术、Transformer模型、ChatGPT技术发展历程、ChatGPT相关数据集等几个方面详细介绍了ChatGPT技术。大型语言模型、语言模型架构、无监督预训练、监督学习微调、自编码语言模型以及自注意力机制等构成了ChatGPT强大的算法和算力。
张老师认为,ChatGPT模型与以往大型语言模型相比具有显著的优势。ChatGPT-4相较于ChatGPT3.5并非小数点的进步,而是指数型的增长。ChatGPT的强大依赖于它使用了更高的计算资源,它具有更高的准确性以及更强的自我学习能力。目前,与ChatGPT的交流不仅止步于“书信”,微软公司发表了一篇名为《机器人ChatGPT:设计原则和模型能力》的论文,公布了将其应用于机器人上的研究成果。张老师也指出了ChatGPT现阶段仍存在的缺陷和隐患:信息误判、信息滞后、知识产权、社会隐患、成本高昂等。最后,张老师回答了同学们的提问。张老师展望了目前专业和学术能力已经达到了人类水平的ChatGPT,在不久的将来将具备从视频中获取和分析信息的能力。
教务处 王珩供稿