生成式人工智能技术在招标采购行业的应用及趋势
□文/汤骏 南通市公共资源交易中心
【摘要】文章介绍了生成式人工智能的发展现状、技术特点和应用场景,并结合南通市公共资源交易中心研发的“公共资源交易大脑”辅助决策平台五个应用项目的具体应用,分享了其创新成果、主要成效和实践体会。同时,针对生成式人工智能技术在招标采购领域应用时存在的机器幻觉、算法黑箱等问题,给出了应对措施,并对该技术在招标采购领域的发展趋势进行了展望。
【关键词】生成式人工智能;招标采购:公共资源交易大脑;数智交易
一、概述
2023年3月,ChatGPT火爆登场,生成式人工智能(GAI)技术成为各界关注的焦点。其中,大规模语言模型(LLM)的卓越表现促使各行业迁速将目光聚焦于 AI这一新兴赛道。当前,我国众多行业全力研发基于 GAI技术的垂直领域创新应用场景,招标采购行业理应乘势而上。
南通市公共资源交易中心自2023年下半年起,积极投身于 GAI技术在招标采购领域的应用研究,开始研发“公共资源交易大脑”辅助决策平台(以下简称“交易大脑”)。平台主要以自然语言处理(NLP)和大语言模型(LLM)作为核心技术框架,聚焦招标采购领域急难愁盼”问题,提出人工智能整体解决方案。2024年10月,中心首批五个应用项目的研发工作顺利收官,相关成果赢得了业界专家的充分肯定。
一、技术特点与应用场景
(一)GAI技术的主要特点
GAI技术具备强大的语言理解与生成能力,能精准理解招标采购相关的各类文本信息,包括招标文件中的复杂条款、投标文件中的详细方案等。它可以迅速分析海量数据,挖掘其中的关键信息与潜在价值,为决策提供有力支持。
NLP具有丰富的知识涌现能力:适用于文本生成,在招标采购领域可用于生成招标文件中的规范条款、投标文件的初步框架等,能大大提高文本创作效率与质量。
LLM具有强大的逻辑推理能力适用于标书评审,能依据预设的评审标准和逻辑,对投标文件中的技术方案、商务条款等进行深度分析与推理,准确判断其优劣,为评审提供科学依据。
(二)GAI技术应用场景
在招标环节,GAI技术可助力招标方精准确定招标需求与范围,通过对大量历史数据和市场信息的分析,制定更合理的招标方案。同时,能自动生成严谨规范的招标文件,减少人为编写错误与漏洞。
在投标环节,可为投标方提供智能辅助,如分析招标文件重点、提供针对性的投标策略建议、优化投标文件内容等,提高投标成功率。
在评审环节,利用 GAI技术的强大分析能力,对投标文件进行全面、客观评估,可以有效避免人为因素干扰确保评审结果公正公平。
在合同管理阶段,GAI可对合同条款智能审查,预警潜在风险,保障合同顺利履行。
三、南通“公共资源交易大脑”项目概况
南通基于 NLP和 LLM 技术搭建的五个应用项目分别是 AI智能评审系统、交易智能体、智能审查机器人、智能问答机器人和招标采购文件生成机器人。
(一)实例解析
1.智能问答机器人
2024年12月6日,智能问答机器人对某政府采购项目评审标准量化设置问题进行了答复,其对量化与细化标准的处理展现出了高度的理解力与定性分析能力。当用户提出请求时,其能迅速准确地捕捉到用户需求点,并给出针对性地修改建议。这些建议不仅切中要害,而且具有高度的实用性和可操作性,体现了其在解决实际问题上的强大实力。
从答复的整体情况来看,其表现堪称优秀。答复内容条理清晰、语言流畅,使用户能轻松理解并接受其观点和建议。无论是处理已知问题,还是面对未知挑战,其都能凭借其深厚的知识储备和强大的推理能力,给出令人满意的答复,充分展示了大模型在处理复杂问题、提供智能化服务方面的巨大潜力和广阔前景。
同时,我们选用国内外知名大模型作了平行测试。测试题共有20题:其中5题来源于行业主管部门权威答复,有明确标准答案;12题来自本地区公共资源交易领域的热点咨询问题,重点考察机器人在特定领域中的适用性;3题属于招标采购领域内的开放型问题,这些问题具有争议性且尚未形成共识,用于评估机器人的创新性和推理能力。
评测分别从准确性、覆盖面、偏离度三个维度进行横向比较,最终评测结果显示,在权重总分方面,智能问答机器人以81.18分排名第一,文心一言、Kimi、智谱清言和ChatGPT分别以77.58分、76.09分、74.32分和74.27分位居第二至第五位。
2.智能审查机器人
智能审查机器人主要功能是审查各类公共资源交易文本,确保其符合国家法律法规,满足优化营商环境、实现公平竞争等各项要求。
智能审查机器人运用文本分类和语义推理技术,通过构建公共资源交易法律法规知识库,实现招标文件自主审查、智能预警和快速检测,能第一时间纠正文件中的错误与偏差,给出修以点见机建议。
3.交易代理智能体
智能体依赖大型语言模型作为核心决策和处理单元,具备独立思考、调用工具和完成目标的能力,能自主行动、感知环境并作出决策。
交易代理智能体的意义在于其彻底改变了人必须通过程序语言面向操作系统的工作模式,实现了人通过自然语言面向智能体的根本转变,使用者只需要简单口述“任务需求”,完全不用理会背后专业的程序指令和操作逻辑,复杂琐碎的操作统统交由智能体自主完成。
目前,南通的智能体已实现了招标计划发布、异常交易信息登记等功能,未来所有涉及线上操作的步骤将全部由其完成,即只要会说话,就能做交易。
4.AI智能评审系统
招标采购评审一般包含三部分内容:一是客观性评审,例如资质等级、资格条件,这类内容评审一般不存在歧义,对于AI来说轻而易举;二是半客观性评审,例如类似项目业绩、荣誉奖项等,涉及少量主观判断的部分,对于AI而言,适度引入规则引擎或者经过模型微调,同样能正确判读;三是主观性评审,例如施工组织设计方案、专项安全应急预案等,这部分内容属于开放型内容,属于纯粹的主观性评审内容,需要评委结合专业技能和经验自主判断,如果没有合适的算法模型,AI可能推理出不可预料的后果。
通过对比某物流中心用房项目评标办法的人工评审和 AI评审,我们发现,两者结论并不完全一致,人类评委在业绩等方面犯了一些错误,而AI却能准确地指出所有的问题。
对于纯粹的主观性评审内容,完全交由 AI推理存在一定的风险。我们使用了“多维度自然语言处理+评标规则解析+知识图谱”方法对其进行可控评审:首先,结合项目评审要求引入多维度自然语言处理技术;其次融入评审专业的知识图谱,利用自然语言处理技术对评标办法进行解析并生成具体的 AI评审规则;最后,构建AI评审矩阵。该矩阵将各技术分支在不同评审项中的关注点和贡献度以量化方式展示出来,达到评分过程可视化、评审结论透明化。此外,为加强评审内容的可解释性,我们还要求 AI强制输出评审依据和思维推理过程, AI都给出了相应的分析结论。
我们对人机评审结论进行了对比分析,计算出两者之间的皮尔逊相关性系数为0.77,平均绝对误差0.37均方误差0.21,表明两者之间存在较强的正相关性。这意味着在监督学习模式下,AI的评分与人类的评分趋于一致。同时发现,人机评审得分的标准差分别为0.237、0.276,表明两者的评分都较为集中且得分波动较小然AI评审与人类评委的评分标准可能较为接近,但是仍存在一定的差异。
AI协助人类完成主观性内容评审的主要障碍是找不到各方公认的“对齐样本”,下一步,我们将进一步改进算法。目前,中心正在研发一项新技术-基于对比学习的提示衍生虚拟语义原型,并以此作为下一代智能评审的主要工具。
5.提示衍生虚拟语义原型
提示衍生虑拟语V原型的其木盾理是通过提示学习(分类、摘要、推理和句子嵌入等 NLP任务)构建正向语义原型,并使用提示的否定形式推导出负原型。目前,我们已经将其引入到招标采购智能评审活动中。
(二)理论成果与实践体会
1.GAl架构是数智化转型升级的有效技术路线
“交易大脑”项目采用NLP技术与 LLM相融合的架构,其能深入理解转坦M处理复杂的目然语言信息,业有]高招标采购活动的效率和决策的准确性。这一架构是人工智能中比较适合招标采购场景任务的技术。
2.“Al评审”的发展路径要经历三个阶段
第一阶段(机器辅助人类),计算机的智能化程度尚处于较低水平,不具备逻辑推理能力。此阶段,机器在智能评审中主要发挥辅助人类的作用,其所能承担的任务相对较为简单和基础。
第二阶段(人类辅助机器),计算机的智能化程度实现了显著提升,搭建好规则引擎后,机器能按照既定规则给出正确判断意见。这一阶段,机器能较大程度地协助人类完成众多烦琐且耗时的评审任务,极大地提高评审工作的整体效率和准确性。
南通的 AI评审系统初步具备了以上功能,对于客观性评审内容基本不需要人工干预,AI评审的准确率较高。
第三阶段(人机互动评审),AI技术凭借其强大的智能算法和深度学习能力,能独立自主地策划评审方案,根据项目的具体特点、需求以及行业标准,制定出科学合理、全面细致且具有高度针对性的评审策略。同时,它还能在人类规则的约束下,精心设计评审流程,确保各个评审环节之间的衔接顺畅、逻辑严谨,实现真正意义上的智能化、自动化评审。该阶段,AI在主观性内容评审方面同样能大显身手,评审结果的可解释性大大增强。
南通在这方面已经迈开了实践探索的第一步,改变了传统的“静态评审”模式,实现了评委通过与大模型的互动实现“动态评审”。在评审中评委可以通过大模型向投标文件进行提问、摘要和分析,从而最大程度地保证评委能以最高的效率知悉投标文件的具体内容。评委对投标文件的理解更深入细致,评审的结论更合理可靠。
对于主观性内容评审,南通计划采用先进的算法模型一“基于提示工程的虚拟语义原型”方法来构建“对齐样本”,再通过计算投标文件与语义原型的相似度,得到此类评审的结果。从当前测试情况来看,这有望成为解决AI在招标采购领域智能评审环节的突破口。
3.招标采购+Agent有望开启“交易动口不动手”新阶段
招标采购与Agent技术的深度融合,将重塑招标采购领域的工作模式。Agent技术犹如一位智能助手,解放了操作者的大脑和双手,操作者仅需向智能体清晰交代任务需求,后续所有工作便可全部交由智能体高效完成,无需了解系统操作逻辑。
同时,AI与智能体的强强联合打破了传统平台之间的交互限制壁垒。以往,不同平台之间的数据交互往往依赖于特定的接口和复杂的协议转换,而现在,借助 Agent技术,各个平台之间能实现使用自然语言直接进行交互,大大促进了信息无障碍共享。招投标各方都可以更便捷地获取和传递关键信息,进一步提升了整个招标采购生态系统的协同效率。
南通在“招标采购+Agent”应用方面已实现了两个任务场景:在招标信息发布场景中,智能体能根据用户提供的项目基本信息自动生成规范、准确的招标公告,并精准地发布到指定的平台;在流标信息登记场景中智能体可以自动收集并整理流标项目的相关数据和信息,然后按预设格式进行高效登记和存档,为后续的分析和决策提供数据支持。
值得一提的是,如果电子交易平台的解耦程度能进一步提高,实现更高层次的模块化和独立性,那么所有的操作都具备Agent化的巨大潜力。这意味着,只要操作人员能清晰、准确地将交易目的告知Agent,无论任务多么复杂,它都能忠实地执行人的指令,精准完成各项操作。这将进一步降低招标采购交易门槛,便烦琐事务中解脱出来,将更多精力投入到核心业务决策和战略规划等更具价值的工作中。
4.LLM+RAG(检索增强生成)是构建智能问答的可行方案
在构建智能问答系统过程中,我们发现LLM+RAG(检索增强生成)组合是一条切实可行的技术路径。
实践中,我们充分利用交易平台长期积累的丰富数据资源,构建了专业的问答数据集,涵盖招标采购领域众多常见问题、复杂案例以及关键知识点,为后续的模型训练和优化提供了坚实的数据支撑。随后,我们引入RAG方法来强化大模型的对话推理能力,通过将问答数据集中的知识与大模型的强大语言理解和生成能力相融合,使得模型在面对用户咨询时,能更准确、全面地理解问题意图,并生成更具针对性和实用性的回答。
实践结果证明,以RAG方式强化基础模型的应答能力相较于单纯依靠预训练+微调方式具有一定的优势。后者虽然在一定程度上能提升模型性能,但往往需要耗费大量的计算资源和时间成本,且对于领域特定知识的融入相对有限。而前者能在不显著增加计算负担的前提下,快速将新知识融入模型,使模型能实时获取最新、取准确的信息,从而显著提高回答的质量和效率。
5.GAI参与投标评审具有广阔空间和极大应用价值
从南通的研发历程来看,GAI参与智能评审前景广阔,虽然还存在一些有待完善的地方,但是从大语言模型的发展态势来看,无论是评审依据的充分性、评审过程的公开性,还是评审结论的可解释性,都不输经验丰富的人类评委,有的方面甚至更强。尤其是“虚拟语义原型”等模型的出现,为AI参与主观内容评审扫清了障碍,有效回避了法律障碍。
如果AI评审能在国家政策层面予以推广和应用,那么当前招标采购领域存在的很多问题都有望迎刃而解,诸如评标专家库的组建与评委的管理、评审费用的支出、远程异地评审等做法都将面临重大变革,管理对象将从“人”转向“AI技术”。
(三)存在问题及其应对措施
1.机器幻觉
机器幻觉产生的核心原因在于大模型对海量数据的学习模式存在局限性。它在处理招标采购相关文本时,虽然能依据数据中的统计规律生成内容,但是难以真正理解语义逻辑的深层内涵。
为有效应对机器幻觉问题,一方面,要强化训练数据的管理。对用于训练模型的招标采购相关数据进行严格的清洗和筛选,去除其中可能存在的错误、模糊或过时信息,同时增加高质量、权威性数据的占比,从数据源头减少幻觉产生的诱因。另一方面,建立人工监督与反馈回路。让招标采购人员定期对模型生成的结果进行抽检与评估,当发现机器幻觉现象时,将错误案例反馈给模型开发团队,以便针对性地调整模型的训练策略和参数,逐步提高模型对语义逻辑的理解能力,降低幻觉出现频率。
2.算法黑箱
算法黑箱现象的根源是大模型复杂的内部结构和高度非线性的运算机制。在招标采购领域,由于模型决策过程难以直观理解,使得交易各方难以信任模型给出的评审结果、策略建议等。
针对算法黑箱问题,一方面,开发可视化解释工具。通过可视化技术展示模型在处理招标采购数据时的内部运算流程,例如以图形化的方式呈现数据在不同神经网络层的转换过程、特征提取与权重分配情况等,使专业人员能大致了解模型的决策依据和关键影响因素。另一方面,采用局部可解释性技术,针对模型的特定决策结果,找出对该结果产生主要影响的输入特征和中间计算过程,为决策提供定程度的解释说明。
(四)趋势与展望
招标采购领域运用 GAI技术尚是一片处女地,是富有巨大前景的蓝海其合理使用必将催生大批创新性应用成果,甚至可能引发行业的整体性重构、系统性变革,有望推动招标采购从全流程电子化交易时代快速迈入人工智能“数智交易”新时代。这项技术可能是招投标行业诞生以后最重要的转型升级机会。