建筑数字化的更高处上海建工为什么要做行业大模型？参编的首本建筑业生成式AI应用白皮书里，有答案

函煜健康管理 2024-12-20 1 0

近期，由腾讯研究院、腾讯云与北京建筑大学联合组织编撰的首本建筑业生成式AI应用白皮书——《生成式AI人居领域应用趋势调研报告》正式发布。在对10多位建筑行业专家学者访谈的基础上，白皮书聚焦大模型等生成式AI技术在建筑行业的应用现状与前景，为全行业的人工智能技术发展提供参考、指导。上海建工四建集团工程研究院新技术研究中心副主任、建筑人工智能研究室主任张英楠，参与了访谈和白皮书编撰工作，重点谈论了7个方面的内容。往下看↓↓↓ 1.人居领域有必要做行业大模型吗？张英楠：从2020年10月组建以来，我们作为专注于建筑人工智能算法研发的施工企业团队，已经发布了多款创新的产品。我们的首个产品是一款供行业一线人员免费使用的钢筋钢管云点数小程序，现在已经获得近2万注册用户。去年，我们推出了一款基于语义监督学习的施工方案智能生成云平台，可以自动完成工况计算和文字生成，把编撰施工方案所需的时间从1小时缩短到3分钟。我们还开发了一款人工智能CAD插件，可以一键生成施工方案图纸，大大节省了绘制图纸的时间。最近，我们研发了行业内首个百亿字符的知识增强对话大模型——Construction-GPT，它不仅能开展智能检索，还能像行业专家那样与工程师展开对话，提供精准的答案。我们的目标是围绕企业业务需求，为一线技术人员提供便利工具，来支持现场管理、施工模拟和日常工作流程。实践经验证明，建立建筑行业大模型不仅可以解决现有的工作痛点、优化流程、提高效率，也有助于推动行业的科技进步和创新，从而实现行业的深度变革。 2.人居领域行业大模型的基础是什么？张英楠：在研发行业大模型时，企业主要采用三种方法。第一种是购买现成的商业大模型API接口，并将其集成到企业的数字化业务流程中，这种方法效率高、开发难度低，但可能存在数据安全和高成本的问题。第二种方法是部署开源大模型，可以避免数据和网络安全问题，同时降低成本，但可能无法完全满足企业的业务需求。第三种方法是基于开源大模型，自主开发针对特定业务场景的编码器和解码器，进行监督微调和价值对齐，保证数据和算法的分离。这种方法虽然开发难度高，但可以解决安全问题，保证大模型的性能，并在使用-反馈-优化的过程中提升企业大模型构建的能力。企业需要根据自身需求选择适合的研发方法，并注重企业大模型构建能力的培养。通过不断的试验和优化，企业可以逐步构建适应自己业务需求的智能体，从而实现AI在人居领域的高效应用。 3.人居领域大模型的数据层如何建立？张英楠：在人工智能的三大要素中，目前我们更重视数据质量，而非仅侧重于算法。类似学习过程，关键在于学习内容的正确性和价值，而非学习的量。曾经，大数据概念被过度强调，但我们已认识到，对于满足特定业务需求，数据质量同样重要。因此，近期我们在数据质量上做出大量努力，确保数据质量后再进行模型训练，从而减少对算力的消耗，提高算法效率和模型性能，达成更高效的结果。有时，模型效果未达预期可能并非模型参数或结构问题，而是源于训练数据质量不佳。我们强调的是数据质量而非数据量。在模型效果未达预期时，我们需要先审视训练数据的质量，而非仅仅调整模型参数和结构。 4.人居领域大模型算法层如何建立？张英楠：在开发Construction-GPT对话大模型过程中，我们实现了三项重要的技术创新。首先，建立的建筑专业词嵌入模型帮助深入理解建筑专业知识。其次，运用的半监督微调策略通过用户反馈进行强化学习，进一步优化模型性能。最后，根据建筑行业的特性，实施价值对齐确保模型效果更加贴近实际需求，而且支持24种文件格式的内容解析，展现出高度的实用性。面对高并发量的问题，我们选择自行开发异步计算代码以处理大量的请求，而不是购买昂贵的外部云服务，这不仅节约了成本，也为这个大模型及其他建筑AI产品提供了更高的处理能力。当前，Construction-GPT仅供企业内部人员使用。建立专业词嵌入模型、实施半监督微调、进行价值对齐的建筑领域大模型至关重要。 5.如何搭建人居领域大模型的平台层？张英楠：在我们的应用中，我们充分利用了云厂商所提供的OSS对象存储服务，以便管理我们的数据负载。同时，为了实现模型的高速计算和处理，我们也引入了推理端的GPU计算能力服务。这两项技术的结合，有效地提升了我们的处理速度和数据管理能力，成为我们服务中的重要组成部分。然而，当考虑到向量数据库和大模型托管的实施，我们必须认真评估相关的成本问题。按照我们目前的企业用户量以及效益折算情况，这两种技术的实施并不能保证我们能够平衡成本。这引发了一个问题，就是如何在满足技术需求和成本效益之间找到一个平衡点？此问题的解决方向可能需要整个行业的协同与整合。仅凭我们单一的企业力量，很难实现向量数据库和大模型托管技术在成本效益上的平衡。但是，如果行业能够实现有效的协同与整合，不仅可以分摊这些技术的成本，同时也可以从中获得更多的行业共享资源和技术红利。从平台层次的角度进行观察，体现了人居领域大模型在技术实施和成本控制方面的复杂性。对于技术选择，需要基于其对业务影响的理解和评估，同时，也要对技术成本有全面的预测和控制。在实际操作中，把大模型应用到平台设计中，需要在技术优势、业务价值和成本效益之间找到最佳平衡。 6.在建设运维端行业大模型可能有哪些场景？张英楠：我们研发的对话大模型Construction-GPT收录了规范标准、工程图集和集团内部的内控技术文件。虽然它能理解行业知识并生成专业解答，但我们发现大部分需求集中在查询规范和图集上。因此，在V1正式版中，我们专门加入了Agent来满足这些需求，以便更好地协助同事们的日常工作。此外，我们的大模型也可以通过API服务接入企业的其他数字化业务和产品中。目前，我们正在与四建集团内的城市更新研究中心合作，把大模型智能问答功能集成到他们开发的历史建筑数字孪生平台中。这样，用户可以在平台上进行专业问答，实现大模型的“一模多用”，为更多数字化业务和产品提供支持。对话大模型在施工、管理和运维场景中发挥了核心作用，既满足了专业知识查询的主要需求，也通过与数字化业务和产品的集成，扩大了它的应用范围。大模型的可扩展性是惊人的。 7.行业大模型会对建设运维端带来哪些影响？张英楠：我们的大模型目前仅供企业内部使用，但我们认为需要行业整体的顶层设计和统筹。建议由行业主管部门牵头，邀请设计、制造、施工、运维等各阶段企业共同参与，多方协作以摊薄成本、共创效益。目标是共同构建行业大模型，赋能整个行业，同时每个企业根据自身需求构建企业大模型，实现行业和企业大模型的融合，甚至发展成建筑业智能体。我们还希望已有的公开大模型产品在行业内有市场推广机制，需防范忽视个体需求与整体的失衡。开展建筑人工智能研究是个长期工作，打造建筑大模型是个持续工作，在尺度定律的条件下，百亿字符已是过去式，千亿字符甚至万亿字符的阶段已经来临。但是，未来仍有诸多问题有待解决，例如：理论层面需要解决计算不可约性带来的负面影响；应用层面需要平衡好研发、时间、业务、市场与成本之间的关系，更需要各方通力合作，共同创建行业大模型生态。四建集团：行业内首家通过深度合成服务算法备案与拥有深度合成服务资质的主体企业根据《互联网信息服务深度合成管理规定》，国家互联网信息办公室在今年4月11日公开发布了第五批境内深度合成服务算法备案信息，四建集团建筑人工智能研究室自主研发的建筑工程技术资料对话大模型“Construction-GPT”引擎底层算法——“上海四建Construction-GPT内容生成算法”上榜。四建集团也成为了行业内首家通过深度合成服务算法备案与拥有深度合成服务资质的主体企业，可以正式向市场用户提供“上海四建Construction-GPT内容生成算法”等建筑大模型算法服务。未来，四建集团将继续积极探索建筑人工智能新领域，充分利用人工智能技术层级多样与功能辐射广阔的优势，与传统建筑场景深入融合，赋能建筑业新质生产力发展，进一步推动数字化转型升级。