《这就是ChatGPT》 by 斯蒂芬·沃尔弗拉姆(Stephen Wolfram);
这本书是Stephen Wolfram写的,应该是对chatgpt原理解释的最好的书了;
1、2013年以来因为平行运算和GPU的发展,大幅提升了矩阵运算的效率,促成类神经网络与深度学习的发展。因此,建立在神经概率语言模型的基础上,推出了各种类神经网络相关的语言模型,一次突破了以往自然语言处理的能力;
2、多层多参数神经网络(大语言模型);根据大量语料进行训练,得出含N个参数的函数,使用时通过你输入的问题,得出最大概率的回答,语句中得出下一个词的概率,取概率最大的;
3、人给出提示词(prompt)对chatgpt模型进行微调;微调的是参数,而不需要重新再算所有参数;
4、“人在环路”的强化学习;如:chatgpt给出答案后,你可以给他点击“好”,“不好”的反馈;
#人工智能
#机器学习
#chatgpt
@programmingsrchub