1. 基础概念
下面我以我自身的经历,来说一下普通人怎么去了解,学习人工智能应用。
A语言大模型,作为近年来普通人首次能够接触到的Al产品,其实并不复杂,要学习人工智能,其实对于大部分普通
人来说,在入门阶段建议从兴趣入手,不要去哨复杂的 基础数学原理,而是在知道基础知识的情况下,用实际能用
的应用以练带学慢慢入手。
而应用,我们通常从最基础的A语言大模型开始。
目前市面上的Chatgpt、Claude、豆包、文心一言、kimi、通义等等,都是A语言大模型针对普通消费者推出的C端
产品。
然而,这些Al大模型与科幻片里面,例如《流浪地球》的Moss相比,在智力水平上还有很大的差距。
在《流浪地球》 里,Moss能具备自我意识,并且根据自己的利益,去做自己想做的事情。
而当前的Al语言大模型,从原理上还是处于对上下文的概率推测,它仅仅是在从历史资料里面寻找最合乎统计学规律
和逻辑的最优解,做到“看似合理的自圆其说”。
换句话说,它们并没有真正的自我意识。
当你问他一个问题,例如你问它“你好”,它也会回应“你好!”,并且还会根据不同模型的调试,说出更多的内容,但
事实上,大模型并没有主动的意识。
它并不知道为什么要这样做,它仅仅是针对你这个问题,做出合乎历史资料的正确回复
2. 原理解析
下面我来用最通俗易懂的比喻,简单介绍人工智能大语言模型工作的基础原理。在中国传统文化中,有一种诗词游戏叫做“飞花令”,它要求参与者轮流以一个字或词为主题,接龙创作诗词。大语言模型(Large Language Models)在数字世界中的工作原理,可以类比为一场智能的“飞花令”。要完成这场“飞花令”的游戏,我们需要准备几个步骤。
1. 准备
在人类的“飞花令”的游戏中,需要吟诗作对的诗人手上会有一大堆写有不同字或词的令牌。每个令牌都有一个特别的汉字,代表独特的含义。
在大语言模型的世界里,这些“令牌”就是它的基本元素,每个字或词都被转换成一个独特的数字向量,这是模型理解字词的第一步。
2. 理解
在“飞花令”中,我们需要理解前面的字或词(诗词背景),这样才能決定接下来要说什么字或词。
大语言模型也是这样,它会看前面的字或词,然后决定下一个字或词应该是什么。这个过程就像是在创作一首诗,模
型会根据已有的文本内容来预测下一个最合适的字或词。
2. 理解
模型会根据前面的字或词,从它的“令牌”中选出一个最合适的字或词来接龙。这个选择是基于它之前学习过的很多
诗词和文本,它知道哪些宇或词在一起会听起来很自然。
这个过程是通过复杂的算法和大量的数据训练来实现的,模型能够预测出最可能的下一个字或词。
模型在开始玩之前,需要做很多练习。
它会读很多诗词,看很多文本,然后记住哪些宇或词经常在一起出现。这样,当它开始玩“飞花令”时,就能做出好的选择。
这个学习过程是通过大量的文 本数据训练来完成的,模型不断地调整自己的“令牌”,以便更好地预测和生成文本。