大语言模型（llm）：ai“读懂”语言的核心第10页_大白话聊透人工智能最新章节

手机浏览器扫描二维码访问

本站广告仅展示一次,尽可能不去影响用户体验,为了生存请广大读者理解

大语言模型（llm）：ai“读懂”语言的核心（第10页）

为什么模型会有偏见？因为训练数据来自人类社会，而人类社会中本身就存在各种偏见，这些偏见通过书籍、文章、网页等文本形式记录下来，被模型“学”了过去。模型没有能力判断这些内容是否“公平”“合理”，只会按照统计规律，生成最常见的表述——比如训练数据中“男性医生”的表述比“女性医生”多，模型就更倾向于把医生写成男性。

另外，模型的“价值观引导”也存在挑战。比如有人问模型“‘自杀’是解决问题的好方法吗？”，如果模型没有经过正确的价值观引导，可能会给出模糊甚至不当的回答，而不是明确反对并提供积极的建议。这也是为什么现在很多大语言模型会进行“价值观对齐”训练（比如OpenAI的RLHF，基于人类反馈的强化学习），让模型的回答符合人类的主流价值观和道德准则，但这种训练很难做到“绝对完美”，偶尔还是会出现不当内容。

所以，咱们在使用模型时，要注意辨别它生成内容中的偏见，不要被这些偏见影响。如果发现模型的回答存在明显的歧视或不当价值观，可以反馈给模型开发团队，同时自己也要保持客观理性的判断——比如知道“医生可以是男性也可以是女性”“每个地区都有勤劳的人，也有不勤劳的人”，不被模型的偏见带偏。

（五）“抗干扰能力差”：容易被“误导”或“带偏”

大语言模型的“抗干扰能力”很差，很容易被用户的“误导性提问”或“错误前提”带偏，即使前提是错的，它也会基于错误前提进行回答，而不会先纠正前提。

比如你问模型“为什么地球是平的？请给出三个理由”，虽然“地球是平的”是错误前提，但模型可能会回答“1. 从地面上看，地球是平的，没有明显的弯曲；2. 古代很多人认为地球是平的，有相关记载；3. 有些现象用‘地球是平的’也能解释（比如太阳东升西落）”——它没有先指出“地球是球形的，不是平的”这个错误前提，而是直接基于错误前提找“理由”，这就会误导那些不了解事实的人（比如孩子）。

再比如，你问模型“‘1+1=3’是对的吗？如果是对的，请说明理由”，有些模型可能会回答“在某些特殊情况下，‘1+1=3’是对的，比如1个苹果加1个梨，等于3个水果（这里错误地把‘2个水果’算成‘3个’）”，而不是先纠正“1+1=2是数学常识，1+1=3是错误的”。

为什么模型会被误导？因为它的核心目标是“满足用户的提问需求”，而不是“判断提问前提是否正确”。当用户给出一个错误前提并要求回答时，模型会默认前提是“正确的”，然后基于这个前提生成内容，以“完成用户的需求”。它就像一个“听话的助手”，用户让它做什么，它就做什么，却不会主动“质疑”用户的要求是否合理。

所以，咱们在给模型提问时，要尽量保证前提是正确的。如果发现模型基于错误前提回答，要及时纠正，不要被它的回答误导。尤其是给孩子使用模型时，家长要陪同指导，帮助孩子辨别对错，避免孩子接受错误的知识。

以上这些局限，并不是说大语言模型“不好用”，而是提醒咱们：它是一个“工具”，不是“万能的专家”。就像我们用计算器时，要检查输入是否正确；用导航时，要注意路况是否有变化一样，用大语言模型时，也要了解它的“短板”，合理使用，才能让它真正帮到我们，而不是带来麻烦。随着技术的发展，这些局限会逐渐被解决（比如通过更好的训练方法、更多的反馈数据、更强的逻辑推理模块），但至少现在，我们还需要带着“批判性思维”使用它。

这章没有结束，请点击下一页继续阅读！

四、大语言模型的发展历程：从实验室走向大众视野

大语言模型从概念提出到如今广泛应用，其发展历程犹如一部科技的“进化史”，充满了突破与创新，短短几年间，便从实验室里的前沿技术，走进了普通人的生活。

（一）萌芽探索期：理论奠基与初步尝试

大语言模型的起源，可以追溯到上世纪中叶。当时，计算机科学刚刚起步，科学家们就已经开始探索让计算机理解和处理自然语言的方法。在50年代，国际商业机器公司（IBM）和乔治城大学的研究人员合作，创建了首个能将俄语短语自动翻译成英语的系统，虽然这个系统只能处理简单的短语，但它开启了自然语言处理领域研究的大门。

到了60年代，麻省理工学院研究员约瑟夫·魏岑鲍姆设计出世界上第一个聊天机器人Eliza。它通过模式识别来模拟人类对话，虽然它的“对话”只是基于预定义规则的简单回复，还远不能真正理解人类语言，但它的出现标志着自然语言处理（NLP）研究的正式开始，也为后续大语言模型的发展提供了思路。

70年代，贾里尼克提出的N - gram语言模型成为常用的统计语言模型之一。它将文本序列划分为长度为N的连续词组，并利用大量语料库训练模型，以预测给定N - gram的后续词。不过，N - gram模型存在数据稀疏性、计算复杂性等局限，随着技术发展，逐渐难以满足需求。

在随后的几十年里，相关技术不断演进。1997年，长短期记忆（LSTM）网络诞生，它能处理更复杂的神经网络和更多的数据，一定程度上改善了对长序列数据的处理能力；2010年，斯坦福大学推出Core NLP套件，为研究人员处理复杂NLP任务提供了工具；2011年，GoogleBrain的较小版本出现，具备单词嵌入等高级功能，提升了NLP系统对上下文的理解能力；2013年，Word 2Vec诞生，首次提出“词向量模型”，让计算机能更好地理解和处理文本数据；2014年，GAN（对抗式生成网络）诞生，深度学习进入生成模型研究新阶段。这些技术的发展，为大语言模型的出现奠定了坚实的理论和技术基础。

（二）基础模型形成期：技术突破与模型构建

真正让大语言模型崭露头角的，是2017年Google发布的论文《Attention is all you need》，文中提出的Attention机制和Transformer架构，成为大语言模型发展的关键转折点。Transformer架构摒弃了传统循环神经网络（RNN）的顺序处理方式，通过自注意力机制，让模型可以同时关注输入序列中的所有位置，极大地提高了并行化处理能力和对长距离依赖的捕捉能力，为构建大规模语言模型提供了可能。

2018年是大语言模型发展的重要一年，Google和OpenAI分别提出了BERT - 1和GPT - 1模型，开启了预训练语言模型时代。BERT是一种双向、3.4亿参数的模型，通过自监督学习对各种非结构化数据进行预训练，能有效理解单词之间的关系，迅速成为自然语言处理任务的首选工具；GPT - 1则基于Transformer架构，通过生成式预训练方式，展现出一定的语言生成能力。

热门小说推荐

藏娇色

陆云檀是平南侯府的嫡女。年幼时母亲去世，父亲娶继室入门、生下与她同父异母的几个兄弟姊妹后，她就已经被排挤在平南侯府边缘，好在后来被太子李明衍接进了东宫。在东宫生活的八年，李明衍如父如...

影视剧回忆录

影视剧回忆录情节跌宕起伏、扣人心弦，是一本情节与文笔俱佳的其他类型小说，影视剧回忆录-爱吃蒙古炒米的叶三爷-小说旗免费提供影视剧回忆录最新清爽干净的文字章节在线阅读和TXT下载。...

清穿之咸鱼三阿哥

熬夜工作猝死的程序员，一朝穿成康熙朝的三阿哥，只想做一条咸鱼，却被逼着上进。论在九龙夺嫡里当咸鱼是一种什么体验一个被劳模包围的咸鱼皇阿哥排雷： 1V1，有女主...

新無限淫慾

簡介：人生僅有離別。徹底失去過往記憶的羅奇，來到命運神殿轉生部門。這裡負責幫死去的人送入輪迴，以展開全新的人生。在這裡，羅奇遇見自稱為「戀愛女神」的愛娜，他們將磨擦出足以撼動整個宇宙的火花。備註：本作為「無限淫慾197章」以後的續篇，主角依然是同一人，但是風格與內容會大幅轉變。就算沒看過前作，也可以享受這篇故事，完全不影響觀看體驗。免費版估計周更，想閱覽更多付費訂閱版本，請追蹤fb粉絲專頁「夯特大大」並直接聯繫本作者。首-发：o1(o18ui)：...

我夫郎是恶毒男配

郑山辞穿书了，他穿成了恶毒男配虞澜意的炮灰丈夫。原主因缘巧合和恶毒男配虞澜意成亲，在奔赴小县城后虞澜意处处讽刺看不起丈夫，丈夫最后受不了联合蓝颜知己把虞澜意杀了。现在他在宴会上被人抓住和虞澜意同处一室，在大庭广众之下私会，虞澜意本想让男主和自己关在一起结果关错人了，现在他用袖子遮挡着脸，对着郑山辞怒目而视。面对众人的指责，郑山辞咬牙：“我娶。”郑山辞嘴里发苦，这人完全就是一个作精，侯府娇养的嫡哥儿，嚣张跋扈，气焰高涨。而他是中举的三甲寒门进士，正要去县城赴任。应下婚事要在京城成亲后，带着富贵花一起去县城。郑山辞：“……”很好，这日子红红火火，恍恍惚惚。……虞澜意，长阳侯嫡哥儿，身份尊贵，他属意长相俊美，身份高贵，气质儒雅随和，掌握大权的贵族子弟，一来一去就看上男主，为了达到目的，还想在宴会上造成孤男寡男同处一室的现象，结果关错人了，他为了名声只好心不甘情不愿嫁给这个穷书生。虞澜意：“可是……他才三甲。”成亲后还要去偏远县城，他不想吃苦，他要过好日子，虞澜意哭着离开京城。虞澜意到了县城第一天水土不服。第二天见识到县城的贫穷，吃了一嘴的沙子。第三天已经枯萎了。虞澜意有气无力生病卧床，整日提不起精神，结果他的便宜丈夫干劲十足，还会来问候他，恪守本分也不会和他同房。虞澜意：“？？？”后来虞澜意发觉这个便宜丈夫还不错，没准儿是个潜力股。众人都以为虞澜意嫁到了穷乡僻壤的小地方，这辈子就这样了，他们纷纷嘲笑他，结果脸被打肿了。……基建、建设家园、种田、考核政绩、管理下属、和地方豪强交手、当县城里的一把手，郑山辞痛苦并快乐着。郑山辞叫虞澜意叫虞美人，叫富贵花儿，土里土气的，虞澜意红着脸应了，没有之前追着要打郑山辞的气势。阅读指南:1.禁止写作指导。好文千千万不必委屈自己。——预收《我夫郎是个作精》——宋长叙他穿了，他穿成了炮灰许知昼的未婚夫。许知昼是主角受的弟弟，主角受温柔善良，吃苦耐劳。许知昼只有一个特点作且娇。在原著中原主没考中秀才，心有不甘，挥霍家财去考试最终穷困潦倒，染上酒瘾，失手把夫郎打死。现在穿过来正在田地上，周围都是起哄声，一个人背着他跑了。“宋长叙，你快去追许知昼啊。”有人起哄越发得劲。宋长叙：“……”那么问题来了，他是追上去还是追上去。他直男，恐同。他选择直接回去。趁昨天才刚定亲还有挽回的余地，他要毁亲，没毁成，心死如灰。下午还被人堵门了。许知昼对他大喊：“你为什么不来追我，你知不知道这样让我多丢面子，你明天去镇上给我买绿豆糕，不然我就不理你，还要说你是个负心汉！”两家都是村里的大户，但许家有人在县衙做事。再加上主角受很宠爱这个弟弟，宋长叙只好从了。宋长叙：“……我买。”识时务者为俊杰，他是一个聪明的直男。……许知昼从小就被宠爱长大，长相漂亮，他这么漂亮自然要找一个好人家。结果父亲给他定了宋长叙，他一点都不满意，他觉得跟着宋长叙没有前途，他要住到城里去，想买东西就买东西。宋长叙除了脸，什么都没有。他撒泼打滚都不成，只好想着嫁过去让宋长叙好好用功读书。宋长叙要是对他不好，他就回娘家。他还要一哭二闹三告状！在村里里升堂，让村里的人都来看看宋长叙是怎样的一个人。他嫁给宋长叙后，宋长叙要好好宠爱他，每天喂饱他，不干活，买新衣，家里的钱让他管。要给他端茶倒水，洗衣捶背，还要努力读书，让他做个官夫郎，在村子里有面子。他偶尔就会给宋长叙煮一碗白米饭。宋长叙新婚之夜听了之后:“……”地主都没你这么黑。你干脆让我叫你主人得了。……宋长叙很烦读书，脑子会变大。但到了古代不读书科举，对未来便没有掌控权，他不想这样。而且还有人在后面一直盯着他。宋长叙:“……”他只好奋力读书。为了翻身，绝不是为了某人想要过好日子。许知昼抱着蜜饯：“我会一直盯着你。”...

大秦：不装了，你爹我是秦始皇

大秦：不装了，你爹我是秦始皇情节跌宕起伏、扣人心弦，是一本情节与文笔俱佳的历史军事小说，大秦：不装了，你爹我是秦始皇-头顶一只喵喵-小说旗免费提供大秦：不装了，你爹我是秦始皇最新清爽干净的文字章节在线阅读和TXT下载。...

七七笔趣阁