于文轩闽江特聘教授,厦门大学公共事务学院院长,博士生导师
2022年底ChatGPT的出现使生成式人工智能技术找到了可以落地的应用场景,开始真正与产业和社会经济发展结合在一起。生成式人工智能正在深刻影响人类的生产和生活方式。而在国内,尽管中国生成式人工智能企业一直在努力发展自己的大模型,但生成式人工智能技术在算法和算力等方面的发展和应用遭遇了一系列的问题。特别是在政务服务领域,国内政府部门在采纳人工智能技术方面整体上一直比较保守。
DeepSeek的出现改变了这种状况,国内地方政府开始纷纷接入DeepSeek大模型。2025年2月16日,深圳市完成了DeepSeek满血版模型在政务云上的部署,成为广东省甚至是全国首个基于政务云在全市范围部署DeepSeek大模型应用的城市。可以预见,“政务云+DeepSeek大模型”会成为中国电子政府发展的新浪潮。DeepSeek在国内得到政府部门的拥抱,除了DeepSeek的国产开源安全可控、算法先进、算力要求低以及高质量输出外,一个重要原因是DeepSeek创新地推出了思维链功能,在一定程度上缓解了生成式人工智能算法黑箱和算法幻觉的问题。
生成式人工智能技术的大模型极为庞大和复杂,算法推理过程的不可解释性一直限制和阻碍生成式人工智能的进一步推广和使用。大模型“黑箱”和时常出现的大模型“胡说八道”(算法幻觉)一直是“大模型+政府服务”的痛点和难点。过往有些企业采用的闭源和私有化大模型的商业模式使得这个问题很难解决。
DeepSeek创造性地公开了大模型思维链,系统展现结论生成前的推理环节,为用户构建了清晰的推理轨迹,显著提升了算法推理过程透明度,有效缓解用户对算法输出结果的无力感,有效地提升用户对算法结果的信心。DeepSeek开放算法思维链对进一步提升人机信任和促进生成式人工智能的技术扩散与发展有里程碑意义。
一、思维过程从“不可见”到“可视化”
DeepSeek从训练源头就采用了无须人类反馈的强化学习,再加上其所使用的“群体相对策略优化”(Group Relative Policy Optimiza0,GRP),使得其预训练费用不到OpenAI GPT-4o模型训练成本的1/10。[1]低算力和低成本优势赋能了DeepSeek思维推理过程的“可视化”。DeepSeek将完整的推理过程展现给用户,让用户能够理解和验证每一步推理的合理性。这在很大程度上使得算法输出质量可控。通过完整思维链展示,用户能够实时识别推理过程中的潜在偏差或错误。这种监督机制是解决传统大模型中可能出现的“看似合理但实际错误”的推理困境的有效方法。从实际效果来看,DeepSeek的市场表现印证了其“公开思维链”技术路径的优势。截至2024年1月31日,DeepSeek已对接超过100款应用,日活跃用户突破3000万,展现出强大的市场影响力。[2]这种规模化应用正在推动一场深层的技术变革,从根本上重塑着各个领域的人工智能生态系统。
二、从“答案导向”到“思考导向”
由于ChatGPT等大模型的算法黑箱,用户与人工智能模型互动的方式主要是用户通过提示词工程对大模型发出指令,然后根据大模型输出的结果不断优化提示词,从而产生相对满意的输出结果,事实上这样一个不断调整问题的方式,将用户的注意力从对产生结果过程的思考,转向了结果的产生,忽略了对结果如何产生和为什么会产生这样的结果的底层逻辑的关注。这种基于“问答式”的人机交互让人类越来越依赖AI给出的答案,在不知不觉中弱化了自己的思维能力。教育工作者对这一现象已经表达出深深的忧虑。
DeepSeek的思维链让我们看到了另一种人机交互的可能。DeepSeek将产生结果的过程用层层递进的形式思维展示,不仅仅提供了“答案”,更是呈现了一种系统化的思考方式。DeepSeek的思维链犹如一位富有经验的导师,引导用户沿着清晰的思路逐步深入。用户不再只需要专注于提示词的精准设计,而需要查阅Deepseek的推理过程,把握每个“回答”背后的逻辑基础。当发现某个分析维度不够深入时,用户可以即时提出疑问或补充见解。这种交互模式引导用户从“寻求答案”转向“探究本质”的深层思考。
三、从“思考外包”到“思维共振”
生成式人工智能的快速发展,让人类产生了一系列忧虑和不适。人们普遍担心对人工智能的依赖,使得人类的思考被外包,人类丧失了思考的能力。人工智能算法的黑箱化和算法幻觉的存在加深了人类对人工智能算法的不信任,严重阻碍人工智能技术的发展和进一步应用。
DeepSeek的思维链有助于缓解用户这方面的忧虑和不适。它不同于传统大模型的直接答案生成,它以清晰可见的思维链展示整个思考过程。Deepseek的思维链不是将概念定义做简单罗列,而是在概念辨析中理解用户到底想问什么,随后进一步展开多维度系统思考。Deepseek层层递进的思维链展开后,“答案”已经不再那么重要,更重要的是所呈现的分析问题的思路和方法。当看到Deepseek的思维链时,用户自身的思维能力也被激活,不再满足AI提供的“答案”,而是开始主动探索其他可能性。这样用户与AI之间开始形成“思维共振”。AI不再是用户思考的“替代者”,而是一个富有启发的认知引导者,不断激发和拓展用户的思维边界和用户思考的深度。这一过程也凸显出人类的核心优势,人类不是在计算速度或数据处理层面与机器竞争,而是在创造力的迸发、情感的共鸣以及跨域思维的整合等方面展现独特价值。当用户通过DeepSeek的思维链打开认知的新维度时,人特有的思维能力不仅没有被弱化,反而在与AI的思维碰撞中获得了更充分的释放和升华。
DeepSeek的思维链使得人机交互的方式产生了巨大变化,将用户从“AI是否会替代人类思维”的忧虑中解放出来,从而转向“如何借助Deepseek思维链助力用户思考”的建设性探索。这种认知的转变标志着人机关系已然进入新发展阶段,从“对立”走向“协同”,从“替代”迈向“共生”。这大大提升了用户对人工智能的信任,对生成式人工智能在政务服务领域的扩散极为重要。
需要特别指出的是,尽管DeepSeek的思维链是人工智能企业解决算法黑箱问题和算法幻觉问题的重要创举,对提升人机信任起到了重大的作用,但是DeepSeek的思维链并没有真正解决算法黑箱和算法幻觉,因为用户仍然不知道DeepSeek这样的思维过程是如何产生的,以及DeepSeek的思维过程是否真正和有效地进行了。这产生了另外一个可能更严重的问题,就是用户对DeepSeek的过度相信或虚假相信。
国外生成式人工智能产品平台Vectara使用Hughes幻觉评估模型(HHEM)对全球主流大语言模型进行了评估。DeepSeek-R1的幻觉率达到了14.3%,远高于阿里通义千问的2.5%(2%-3%之间),GPT-4的1.4%,以及小于1%的Google Gemini-2.0-Pro-Exp、OpenAI-o3-mini-high-reasoning。尽管Vectgara的HHEM模型评估的有效性和稳定性有待进一步验证和评估,但是这个评测结果可以起到提醒和警示的作用,提醒我们对人工智能大模型的技术进步和局限保持清醒的认识。政务服务大模型特别是中国政务服务模型的容错率非常低。中国政府的“人民性”决定了中国政务服务大模型需要具备高精准、可解释、可控制、可问责的属性。这要求中国各级政府在部署和使用大模型时保持高度警惕,对大模型进行精确的调教和训练。
↓↓了解更多资讯,请识别下方二维码↓↓
国脉集团是数据资产化专业服务机构,为数据资源拥有者提供专业、规范、合规的全流程数据资产化服务,包括培训、咨询和产品设计等,实现数据资源价值最大化。主要服务于政府数据管理机构、央国企数据运营企业、城市数据运营平台和数据富集型平台企业,打造数据资产网、数据资产研究院和产业专家网络等支撑体系,同时在营商环境与政务领域继续保持领先优势。 主要课程包括数据资产入表、数据经纪人、公共数据运营和政府CDO、数据精品等精品课程。 数据资产化服务:数据资产化战略布局、数据资产入表、数据产品开发及交易等关键任务; 数据要素×项目服务:政策扶持、案例奖项申报、金融支撑和市场变现; 数据产业园区和试验区咨询服务:园区规划、咨询、资源导入