客户评价|
当前位置: 金年会_金字招牌(中国)官方平台 » 成功案例 » 客户评价介绍基于自然语言处理技术的ChatGPT的基本构成和自然语言生成与理解方面的优势,探讨其在博物馆策展、讲解导览、藏品管理、文创开发、研究咨询等方面的适用场景。针对实际应用场景,将ChatGPT的表现与人类员工的表现进行对比实验,论证该技术的稳定性和适用性,分析和阐述以ChatGPT为代表的自然语言处理技术在博物馆领域中的发展潜力和未来前景,以及如何应对技术挑战和限制,有助于推动博物馆的高质量发展。
随着人工智能技术的不断发展,越来越多的机构和行业开始整合AI技术以改进业务流程和提升效率。自然语言处理(Natural Language Processing, NLP)是计算机科学领域与人工智能领域的重要方向,其利用NLP技术代替人类与计算机之间的交互,为用户提供高效、个性化的服务[1]。
在博物馆领域,传统的聊天机器人只能按照预设的语法和回答模式进行交互,受到限制较大。而以ChatGPT为代表的新一代NLP技术能够实现博物馆藏品、文化和数据等内容的自然语言解析和推理,并构建与用户的高效、流畅和个性化的交互[2]。同时,新一代NLP技术还具有自主学习和优化的能力,能够不断提升自身的语言处理能力。因此,对其在博物馆领域的应用场景进行研究势在必行。
智慧博物馆是当前博物馆发展的重要趋势,而NLP技术正是实现博物馆数字化转型的核心技术之一,可以为博物馆提供高效的信息处理和管理手段。研究NLP技术在博物馆领域的应用场景,有助于推动博物馆的智能化进程,提升文化传播的服务品质和效率,为公众提供更为友好的互动场景,为研究人员提供更便利的检索条件,为管理者提供更为高效的管理手段。此外,博物馆领域的NLP技术应用也是文旅领域中NLP技术应用的重要场景之一。研究博物馆领域NLP技术的应用前景,不仅有助于推动博物馆数字化转型和智能化升级,也为文旅领域其他方面的NLP技术应用和普及提供了借鉴和参考。
自然语言处理(Natural Language Processing, NLP)技术是研究人机交互方式的关键技术之一,主要应用于计算机对自然语言文本的处理和理解方面。其核心目标是使计算机能够像人类一样理解、分析、处理和生成自然语言文本,实现对文本的语义分析、分类、标注、命名实体识别、机器翻译、情感分析、自动文摘、语音识别等多种功能[3]。NLP技术的发展使得机器更加智能化,能够处理人类语言交互带来的复杂性,大大提高了计算机处理文本信息的能力,在文本挖掘、搜索引擎、智能客服、语音识别、聊天机器人等诸多领域获得了广泛的应用[4]。
基于NLP技术的语言模型有很多。例如,由Google开发的BERT,由微软开发的DEBERTA,由百度开发的文心一言等,这其中最著名的莫过于由OpenAI开发的ChatGPT。它是一种基于Transformer模型的自然语言处理技术,在自然语言生成方面表现非常出色,能够根据输入的语言文本生成有意义、通顺、自然的新文本。同时,在用户进行追问时,会结合之前的语境改善自己的回答(见图1)。
ChatGPT之所以能够实现连贯性的生成自然语言,是因为它的架构中包含了多个编码器和解码器层,每一层都可以对文本进行理解和生成。此外,它还通过无监督学习技术,在处理大量自然语言文本时,学习了语言规律和隐藏信息,从而大大提高其自然语言文本的生成能力。现时,ChatGPT已广泛应用于文本自动生成、文件处理和高效生产工具应用等方面,成为NLP领域的重要突破。
ChatGPT使用了生成式预训练变换器(Generative Pre-trained Transformer)的技术,即利用大量的文本数据进行无监督的预训练,然后根据不同的任务进行微调。
ChatGPT的输入是一个文本序列,由用户的消息和机器人的回复组成。它的输出也是一个文本序列,即机器人的下一句回复。它使用了自回归(Autoregressive)的方式,即逐词生成输出,并利用掩码(Mask)来避免看到未来的词。
ChatGPT使用了交叉熵(Cross Entropy)作为损失函数,即最小化预测词和真实词之间的差异。它使用Adam优化器(Adam Optimizer)来更新模型参数,并使用学习率衰减(Learning Rate Decay)和梯度裁剪(Gradient Clipping)等技巧来提高训练效率和稳定性。
与传统的聊天机器人相比,ChatGPT在自然语言生成和理解方面具备更高的准确性和流畅度,同时具有更强的上下文感知和理解用户意图的能力[5]。
一是模型生成方式的不同。传统的聊天机器人往往采用事先定义好的规则和模板来生成回复;而ChatGPT是基于大规模数据的神经网络模型,可以在没有人工设置的情况下自主学习和生成回复。
二是理解用户意图的能力不同。ChatGPT可以准确地理解用户的意图,并回答用户的问题或根据用户的语义生成内容,从而提高了交互的质量和效率。
三是上下文感知能力不同。传统的聊天机器人往往难以获取并理解对话的上下文信息,而ChatGPT可以在对话的过程中感知上下文信息,从而更好地理解用户需求并生成更准确的回复。
传统的博物馆观众咨询服务通常需要大量的人力资源和设备支持,经济成本和对人员素质的要求都很高。而使用ChatGPT或类似的NLP技术则能自动处理和回复各种问题,提供准确和快速的解答,降低人力成本、优化用户体验、提高观众满意度。此外,NLP技术可以辅助博物馆进行推广宣传,不仅可以产出背景调研、推广建议、推广方案的内容,也可以协助网络资源、宣传资料、创意文案、语言翻译等工作。
例如,结合博物馆相关数据,NLP技术可以回答用户关于基础信息(博物馆地址、开放时间、门票价格、预约方式)、展览信息(当前或即将开展的展览名称、主题、内容、时间)、藏品信息(具体藏品名称、年代、来源、材料、尺寸)、背景故事(藏品背后故事、历史文化价值)等详细问题。
为了评估ChatGPT与人工客服的表现,我们收集了一批问题,让ChatGPT和人工客服分别对其作出回答。例如,以下两个问题(见图2),人工的回复为“每日9:00—17:00(16:00停止入场),每周一闭馆(除国家法定节假日外)。观众携带身份证可免费参观,可以通过官网或者微信公众号等方式进行预约。遗址博物馆的发展优势主要为:有利于提升访客观感;有利于做好遗址安全工作;有利于带动周边产业。制约遗址博物馆发展的瓶颈问题主要为:受制于遗址的知名度和影响力;受制于遗址看点对公众的吸引力;受制于遗址研究水平的高低。”
结果显示(见表1),与人工客服相比,ChatGPT的回复速度非常快,可以较为准确地回复用户简单的咨询问题,缩短用户的等待时间,在情感交流和语义表达方面,也具有一定优势。但在处理复杂、冷门、敏感的问题时,存在一些错误,尤其是容易出现捏造事实的情况,导致用户被误导。因此,考虑到不同情境下的需求,NLP技术和人工客服可以相互结合,才能实现更好的服务效果。
NLP技术的超强互动性,可以极大拓展博物馆陈列展览的知识边界,甚至在一定程度上取代传统的讲解员岗位。具体来说,NLP技术在展览里可以实现以下3个方面的应用。
通过使用NLP技术,可以分析观众在博物馆中的语言、情感和兴趣,进而实现个性化展品推荐。观众可以通过对话方式告诉系统自己的兴趣爱好和需求,系统再根据这些信息给出相应的推荐展品或线路,甚至直接为观众建立一个互动式的探索游戏。这些个性化的导览服务可以更好地满足观众需求,提高展览的互动性。
通过在展厅内设置NLP系统,观众不仅可以看到基于展品的关键词和历史信息的文本描述,还可以与展品进行互动。NLP技术可根据博物馆提供的信息,生成智能化的讲解语音或虚拟人,自动提供更加深入、细致的文物解说。此外,NLP技术可以根据观众的需求和兴趣,提供个性化定制的讲解信息,例如使用严肃或幽默的语气介绍藏品背后的故事,从而增强观众的参观体验感。
博物馆藏品涉及不同地区的语言和文化,NLP技术可以使讲解装置适应不同的语言和文化背景,以满足不同地域、国籍观众的需求,提高交互的质量和效率。通过NLP技术的支持,观众可以更详细地了解博物馆中的藏品,同时也可以更深入地感受文化多样性带来的魅力。
让ChatGPT与具有相关专业知识的博物馆讲解员分别对同一批文物或展品进行描述。
例如,对于“镶嵌绿松石兽面纹铜牌饰”这件文物,讲解员的标准描述为“器身以青铜铸出主体框架,呈四角钝圆,略呈亚腰形,两侧各有对称环纽。其上以数百片绿松石拼合镶嵌出兽面纹,加工精巧,丝丝入扣。虽历经三、四千年无一松动脱落。出土时安放在墓主人胸部,从两侧有对称的穿孔钮可见,穿缀系于主人胸前,应作为沟通天、地、神、人等的重要载体。” ChatGPT的描述如下(见图3)。
对输出结果进行比较和评估,发现ChatGPT的撰写速度非常快,语言表达流畅且通俗易懂,也能较为全面地介绍文物的相关信息。但是专业性较为欠缺,最重要的是出现了与事实不符的情况(见表2)。因此,结合两者的优点来提供博物馆导览讲解服务可能更加有效。
ChatGPT可以作为追问式的答疑工具,可以解决一些简单、常见的问题,而导览讲解员则可以提供更加深入、全面的解说服务,为游客提供更加个性化、定制化的导览体验。这种以NLP技术和人工服务为结合的方式,可以更好地提高博物馆导览讲解的质量和服务效率,为游客带来更加丰富、深入的文化体验。
传统的展览编排和大纲编制需要策展人大量阅读和处理各种文献资料,耗费大量时间。NLP技术可以通过文本挖掘、主题提取等技术,快速高效地分析并提取与展览主题相关的信息,自动化生成展览大纲,从而大大提高策划效率。NLP技术还可以参与到博物馆的展览测评中,根据测评模型生成展览的测评结果并给出相关建议,辅助策展人提升优化展览。
例如,使用ChatGPT描述策展人的需求,AI会给出展览思路(见图4)。在AI给出思路的基础上,策展人可以不断丰富和改善需求,通过向AI提出更精准的描述词,让AI生成更符合策展人理念的展览大纲。
虽然ChatGPT在分析和处理展览相关信息方面具有较高的智能性和自动化程度,能够显著提高策展初期的效率,但AI缺乏人类的审美,也难以匹配策展人意图,如果涉及到复杂的展览主题和专业性强的内容,仍然需要额外的人工处理。策展人需要结合自身的判断和经验,制定更完整和创新的展览计划。
NLP技术可以根据研究人员输入的文物名称、年代、来源、材料、尺寸等描述信息,通过自动信息提取、数据标准化、数据分类等多个环节,整理出清晰、准确的文物数据类型,确保文物信息的唯一性和标准化。对归类清晰的文物信息,NLP技术可以进行智能分类,如不同文物类型的分类、不同年代的分类、不同材质的分类等,以实现文物信息的有序管理,这些整理后的文物照片、文字信息、音频和视频资料等丰富的信息,可以为博物馆的藏品保护工作提供重要的资料支持。
通过NLP技术与人工处理文物信息的对比试验,例如提取一批文物清单中的绿松石器。人工的回答为:绿松石龙形器、绿松石珠、绿松石兽。ChatGPT则将镶嵌绿松石兽面纹铜牌饰和龙形牙璋也列为绿松石器,且事实上,龙形牙璋并没有镶嵌绿松石装饰(见图5)。
结果显示,由于文物信息的复杂性和多样性,目前ChatGPT在处理文物的基本任务上,并不能够取得人工相当的准确度和稳定性,更不用说涉及到文物的复杂信息处理。因此,依然需要人工干预和审核,才能确保文物信息的准确性和可靠性。未来的藏品管理,NLP技术和人工的深入结合是必要的,需要不断优化和改进相应的系统和工作流程,以提升藏品管理的效率和品质。
NLP技术可帮助文创产品开发者快速处理大量背景信息,包括文物和藏品信息、历史故事等等,从而提供更多信息支持,挖掘历史文化内涵,为文创产品开发提供了可靠的依据,提升文创产品的文化品位和创新。同时,利用自然语言生成和图像识别等技术,实现对文物和藏品的多维度呈现,为博物馆文创产品设计提供新的灵感和思路,从而打造具有品位和差异化的文创产品。
通过NLP技术与人工设计师做文创产品概念构思相关的对比试验,例如以“镶嵌绿松石兽面纹铜牌饰”为主题设计一款生活家居类的文创产品(见图6)。
人工设计师的设计思路为:首先要了解文物相关的历史和文化背景,同时结合现代生活和消费者需求,打造出故事性和富有意义的文创产品。利用绿松石和铜这两种本身具有天然美感的材料,将它们应用于各种生活家居用品中,比如玻璃器皿、地毯、收纳盒等等。融合现代和传统元素,通过一些新颖的造型设计来打造该文创产品。
通过对比,可以发现ChatGPT仅能通过语言输入和输出来与用户进行交互,并没有实际的设计能力和手工创作能力。与之相比,人工设计师拥有更加专业的设计技巧和多样化的设计思路,可以根据博物馆藏品的特点和需求,设计更加创新和个性化的文创产品。
但是,NLP技术在分析文化信息、提取文化元素和创意元素等任务上,仍可以为设计师提供一些灵感和建议,在文化元素的选取、数据过滤和概念构思方面,仍然需要人工来确保最终的产品品质和文化价值。因此,NLP技术在文创开发方面的应用仍需要结合人工智能与设计师的智慧,才能全面提高文创产品的创意度和满意度。
NLP技术为文博科研方面的信息整合和研究提供了一种高效的方法。NLP技术有助于建立语义关系和知识图谱,以更深入、更全面地研究文物、遗址和文化等信息。通过智能分析和语义关联技术,构建信息的知识图谱,将相关信息可视化呈现,更清晰展示信息之间的关系。
此外,NLP技术可以自动识别文物、遗址和文化信息之间的联系,并自动应用到文物研究领域。NLP技术可以将藏品的属性信息之间相互的联系和影响进行自动整合,提高研究人员对藏品理解的深度和精度,进一步丰富博物馆文物研究领域的相关知识。
通过对NLP技术与人工研究员处理文献资料的对比试验。例如关于“二里头遗址与殷墟遗址的共同之处”这个线),人工研究员的回答为:两个遗址都建设有道路,二里头遗址的规划道路最宽处20米左右,相当于现代的4车道公路,发现了中国最早的车辙。从宫殿和道路建设看,两个遗址继承关系明显。
结果显示,NLP技术在分析信息和提取重点等任务上,能够取得相当不错的稳定性、准确性和全面性,从而极大提升研究的效率。但是还是免不了出现一些错误,因此,只有借助人工的智慧进行处理和分析已有资料,以确保最终研究结果的严谨性和创新性。
AIGC(AI generated content)技术是指在人工智能技术的支持下,通过算法生成各种形式的内容,如文字、图像、声音等。它的实现依赖于深度学习、自然语言处理、计算机视觉、音频处理等各种AI技术[6]。
例如,Runway公司推出的Gen-2,可以通过打字描述,制作出逼真的合成视频,任何你能想像到的东西都可以被创造出来。Stability AI公司推出的Stable Diffusion,提供将手绘草图转换为逼真而精致的数字图像服务。
在不远的未来,NLP技术和AIGC其他领域技术的结合可以为博物馆带来更多新的机遇和变革,尤其是在虚拟现实(VR)和增强现实(AR)等领域中,可以实现更加真实和沉浸式的体验。
例如,结合NLP和图像生成技术,将自然语言文本转换为图像的描述语言,然后图像生成技术可以利用这些描述生成与文本相关的图像。这种方法可以应用于许多领域,如自然场景的虚拟现实体验、电影和游戏中的富有想像力的特效等。最重要的是,这种技术可以应用在展览策划与设计中,为更高效便捷地贯彻策展人意图发挥重要作用。
NLP技术在博物馆领域的应用也面临着一些技术挑战,这些挑战可能会对技术进步和应用带来一些限制性作用。主要包括以下方面。
1)专业性较强。博物馆领域的信息量非常庞大,包括藏品的各种文献资料、文物鉴定、文物科技分析、文物修复、文物考古发掘等等。这些信息只有专业人士才能理解和解读。因此,使用NLP技术在博物馆领域进行文本处理和信息抽取时,需要考虑领域知识本身的复杂性,以及领域专业性对模型训练和算法验证的要求。需要将NLP相关技术与博物馆的领域专业知识结合起来,才能够提高抽取的准确度。
2)精度要求高。博物馆承担着社会教育功能,在观众眼中,博物馆代表了权威的解释。因此,如果在博物馆领域应用NLP技术,需要对NLP生成的数据质量和精度准确性进行严格的监控和验证,确保所提供的信息和解释符合历史事实和文化价值,并且有效避免错误的信息对文物和社会造成负面影响。这也需要与业务领域专业人士进行紧密合作,明确数据处理的具体目标和要求,并逐步提高数据质量和准确性,以提高全局性和可靠性。
3)藏品数据安全。由于博物馆领域所涉及的部分数据可能涉及机密敏感性信息,比如文物信息、拍卖记录、修复记录、移交记录等,因此在进行NLP技术应用的过程中需要注意数据安全性,并采取合适的安全措施,如加密、权限设置、网络防护等。此外,还要注重遵循相关法规和政策,确保文物数据的隐私和安全。
知识库是一种存储结构化或半结构化知识的数据库,可以为NLP技术提供丰富而准确的领域知识。通过从博物馆相关的文献资料、网站、数据库等来源中抽取实体(entity)、属性(attribute)和关系(relation),并进行清洗、整合、消歧等操作,可以构建一个包含博物馆领域各类概念、实例、规则等知识的知识库。知识库可以帮助NLP技术进行语义理解(semantic understanding)、语义推理(semantic reasoning)和语义生成(semantic generation),提高NLP技术在博物馆领域的效果。
深度学习是一种基于多层神经网络的机器学习方法,可以从大量数据中自动学习特征表示,提高模型泛化能力和鲁棒性(robustness)。传统的机器学习方法通常需要人工设计特征和使用先验知识,这在博物馆领域可能受到专业性和复杂性的限制。相比之下,深度学习法可以更好地捕捉博物馆领域文本中的语义信息和语境信息,并进行有效的分类、抽取、生成等任务。例如,可以利用大规模语言模型(large language model,LLM)和微调(fine-tune)技术定向训练博物馆应用场景的NLP机器人。
多模态数据融合是指将不同类型或来源的数据进行整合、分析和利用的过程,可以提高数据利用效率和价值。在博物馆领域,除了文本数据外,还有图像、视频、音频等多种类型的数据,这些数据可以相互补充、验证和加密,提高数据安全性。例如,在对文物信息进行抽取时,可以同时利用文本描述、图像特征、视频内容等多种数据源进行交叉验证,避免单一数据源被篡改或泄露;在对文物信息进行生成时,可以同时利用文本描述、图像特征、视频内容等多种数据源进行加密处理,防止敏感信息被窃取或破解。
NLP技术在博物馆领域应用方面,虽然具有很大的潜力,但也面临一些特定的限制因素,主要包括计算资源和性能问题、数据管理和推荐效果、误解和歧义问题等3个方面。
NLP系统在博物馆自媒体或网站应用中,需要处理大量的文本和语音信息,为用户提供智能的问答、推荐、翻译等服务。这些服务对计算资源的需求很高,如果面对庞大的访问量,可能会出现计算资源不足的问题,导致服务质量下降。为了解决这个问题,需要采用分布式计算(Distributed Computing)和低延迟服务(Low Latency Service)等技术,在优化算法和模型参数的同时,提高模型的处理速度和性能,以提高NLP系统的可扩展性和处理效率。此外,在训练过程中也需要较高的算力资源和稳定的数据中心环境等因素支持,否则可能会影响训练效果和模型质量。
博物馆中的文物信息涉及多个领域,如历史、文化、艺术、科学等,每个领域又有不同的分类和属性。这些信息构成了博物馆的知识库,是NLP系统数据管理和推荐效果的基础。NLP系统需要能够对这些信息进行有效的组织、存储、检索和分析,以便为用户提供最合适的信息。同时,NLP系统也需要能够根据用户的兴趣、偏好、需求等因素,进行个性化的推荐,以增加用户的满意度和参与度。例如,ChatGPT在博物馆中主要应用于对话生成和问答系统等场景,利用大规模的对话数据集进行预训练(Pre-training),然后根据不同的任务进行微调,以生成自然、流畅、有逻辑的对话。为了提高ChatGPT的表现效果,选择合适的数据集规模、质量、分布等因素是关键。
一些文物信息的含义和解释会因为文化的不同、历史的变迁等原因,存在误解和歧义问题。这些问题会给NLP系统在理解和表达文物信息时带来困难和挑战。NLP系统在处理这些问题时,需要更多的人工监督和交互沟通,以保证系统的理解和表达的准确性。同时,需要采用一些现有的技术来进行识别和消除歧义,如多义词(Polysemy)和语境分析(Context Analysis)等。
自然语言处理技术在博物馆领域的应用具有广泛的前景和应用场景,特别是ChatGPT的出现为博物馆的信息管理、文物解说和咨询提供了强有力的工具支持。
本文分析了ChatGPT的技术原理和特点,并从实际应用的角度,论述了其在博物馆中的多种应用场景,包括文物解说、自动化咨询解答、信息管理和研究等方面。针对不同的应用场景,在比较 ChatGPT与人工的表现差异时,可以发现ChatGPT在信息处理方面具有极高的效率,在常识表述和提出策略方面具有优势,但在准确性和事实阐释方面明显需要改进。
NLP技术在博物馆领域中具有多方面的应用潜力和价值,可结合博物馆的展览讲解员、客服、策展人、藏品管理人员、文创开发人员、文博科研人员等多种博物馆服务角色,为提升博物馆服务水平、提高社会文化素质和推动文化遗产的保护和传承做出贡献。
本文也提出了未来可能的研究方向和技术挑战,如多模态信息处理、开放领域问答系统、个性化推荐系统等。在未来的研究中,需要进一步开展交叉学科的研究和创新,将自然语言处理技术与其他技术结合起来,探索更多适合博物馆应用的智能化技术,如图像处理、人工智能和大数据等。
此外,还需要考虑安全和隐私等方面的因素,在保护用户信息安全的同时,提高博物馆观众体验和管理效率。总之,自然语言处理技术在博物馆领域的应用是一个不断创新和探索的领域,通过不断探索和改进,将为博物馆提供更加智能、便捷、高效的服务,为观众提供更为便捷的文化旅游体验。
原标题:自然语言处理技术在博物馆领域的应用前景研究,以ChatGPT为例
作者:周鼎凯(二里头夏都遗址博物馆)张枫林(浙江省博物馆)丁治国(中国博物馆协会)陈雨菲(故宫博物院)毛若寒(浙江大学)
1* 本文为2023年文化和旅游部部级社科研究项目“元宇宙赋能博物馆新业态发展的机制与模式研究”之阶段性成果(项目批准号:23DY31) ↑
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
90天自燃869辆,电动汽车已“沦为笑柄”,取代燃油车成“空线年,深圳高中生坐飞机时突然在空中看到,机翼上的铁皮被吹飞
刚刚,杭州出太阳了?!只是暂时的!连发公告,减至三孔!两地洪水橙色预警
百度创始人李彦宏说:我老婆什么都不是,但她最好,这个女人到底有何魅力?
广州龙联科技文化发展有限公司,智慧博物馆建设、民间藏品数字化和乡村振兴数字文化建设方案专家。
2场0-0,直接改变3队命运!欧洲杯11队晋级16强,还有5队提前出局
与中坚力量共成长,2024建信信托艺术大奖评委会特别奖获奖艺术家凌海鹏
佳能 A4 幅面黑白激光打印机 LBP240 系列上市,最快每分钟 40 页
苹果专利探索统一体验:无缝整合 iPhone、iPad、Mac 等算力
金年会官方网站首页入口