ü 对学者:提供跨学科研究方法、前沿案例与理论反思,助力突破传统学科边界。
ü 对机构:作为国家文化数字化战略的学术载体,助力构建数字人文领域的“中国学派”。
ü 对从业者:展示数字技术在出版、文博、教育等领域的落地路径,直接应用于实践创新。
《数字人文》不仅是一本学术辑刊,更是数字时代人文研究范式转型的见证者与推动者,其价值在于连接技术理性与人文精神,为传统文化注入数字时代的生命力。
《数字人文》是由中华书局与清华大学联合主办、中国内地首本专注于数字人文领域的学术辑刊,创刊于2020年,2023年入选CSSCI来源集刊,2024年获评中国知网“高影响力学术辑刊”。作为数字人文研究的核心学术阵地,本刊致力于构建跨学科、跨领域的学术交流平台,推动人文科学与数字技术的深度融合,迄今已出版20余期。
跨学科笔谈:科技如何影响人文教育细节
饶高琦(北京语言大学国际中文教育研究院):大语言模型最适合教语言:语言智能推动语言教育转型
语言智能被称作人工智能皇冠上的明珠,也是本轮人工智能产业爆发的核心。由于语言作为人类思维工具和交际工具的核心作用,语言智能也是人工智能诸技术领域中,最“接地气”、生活渗透率最高的部分。语言智能与视觉智能、智能控制等分支相结合,不仅放大了这些技术的能效,还拓展了它们的落地领域,从而扩大了应用规模、深化了应用层次,并强化了“应用-数据-研发”的正向反馈闭环。
在一系列落地应用中,教育无疑是其中最活跃,也是影响人群最广泛的领域。总的来说,智能技术赋能教育经历了三个阶段:第一阶段,信息技术和自动化技术赋能教务工作;第二阶段,数字技术赋能教学流程优化;第三阶段,智能技术赋能学科内容和教学法。如今,我们在夯实第二阶段成果的基础上,正快速进入第三阶段,而其实现方式仍在探索之中。
笔者认为本阶段实现学科发展的关键在于,通过智能技术革新教学资源的生产和供给(学科内容)以及资源传递方式(教学法),而这两者恰好与当前语言智能的优势领域相契合。以大语言模型为代表的生成式人工智能,具有内容生成能力强、人机交互性能佳的特点,在资源生产和资源传递方面有独特的优势,而以语言智能为核心扩展“泛语言的媒介智能”(如文本生成图片、文本生成视频等)进一步增强了这种优势。然而我们也必须认识到,当前的大语言模型及其衍生智能体,仍存在很多短期内难以克服的缺陷,如生成内容易出现错误、安全性和对齐性问题、垂直性不足、成本高昂等。
综合当前的智能技术赋能路径和技术缺陷,笔者认为语言教育是智能技术在教育领域落地应用中最具优先级的领域。因为相比其他学科,语言教育具有对生成内容的容错性高、形式化程度高、注重交互且参与度高的特点,能够充分发挥智能技术的优势,同时弥补其不足,发挥规模效应,促进教育公平。以语言教育为核心,智能技术的应用还可扩展到“涉语人文教育”:一方面,通过语言渗透人文教育;另一方面,开展以语言工具为核心的人文学科教育,如文学、历史等。
下面笔者分别简要介绍北京语言大学(以下简称“北语”)在语言教育和人文研究中深度融合语言智能技术的案例。
语言教育方面的案例来自北语的核心业务——国际中文教育。自2020年起,北语启动国际中文智慧教育重大工程(以下简称“工程”),推动语言智能技术深度革新国际中文教育资源生产、教学流程和组织制度。笔者有幸作为核心成员参与其中。工程推动建立了国际中文智慧教学系统,其核心价值在于系统内嵌的“国际中文教育知识图谱”(面向内容生产)和“融课件”新型教学媒介(面向资源投送)。
具体来说,在数据资源方面,工程集成大语言模型、结构化检索、信息抽取以及评价相关技术,用于构建教学所需的例句、图片、音频、视频等资源。在此过程中,充分发挥了大语言模型的生成能力,并构建了一套资源筛选、加工和检查的程序。在资源推送方面,工程定义了以移动端为主的融课件推送方式,该方式适应多端,并集成多媒体交互组件(如图1)。利用大语言模型的交互能力和强效检索能力,辅助融课件实现更精准的推荐和分发。
人文研究方面的案例来自北语信息科学学院、国际中文教育研究院。北语依托语言数据资源建设这一传统强项,推动基于语言数据的数字人文研究。在古籍和近代汉语语料方面,多个课题组综合运用预训练模型和大模型等技术,在历史事件抽取、关系分类、文白翻译等方面取得了显著成果,最终促进了基于历史语料的知识图谱构建和检索平台的建设和服务。在现代汉语语料方面,多个课题组同样利用深度学习方法,结合既有语言学和社会学规则,在性别偏见和道德评价等方面进行了积极探索,并基于语言数据绘制了当代性别和道德话语的时空分布图。
此外,值得一提的是,不论是在语言教育中,还是语言相关的人文研究中,智能技术的融入都改变了传统的人员分工方式,教育科研制度正在发生变化。最直接的表现为,智能技术使数据驱动的教学和科研成为可能,从而催生了一系列面向数据的新型分工,如模型训练、提示词工程、资源审核等。同时,传统的教研室和研究室的单一化人员结构被打破,教研室演化为主讲教师、资源助教、交互助教和技术支持人员的混合团队模式,研究室则开始转向数据团队、开发团队和理论研究团队(通常与传统人文团队合作)的分工模式。
随着语言智能技术性能提升、成本降低和易用性增强,笔者相信,以语言教育为核心,以语言相关的人文教育为先导,越来越多学科的教学和科研都将从数字化转型中获益。
■ 教育与教学
跨学科笔谈:科技如何影响人文教育细节
大语言模型最适合教语言:语言智能推动语言教育转型 / 饶高琦
信息编码与需求响应:人工智能背景下的写作课再造 / 李君然
为“智慧课堂”正名 / 冯庆
理论教学中的数字人文方法错位 / 黄雨伦
AI 艺术教学中的思想实验:《蒙娜丽莎》作为AI艺术 / 刘书亮
跨学科教学的若干感想:数字人文的魅与魔 / 丛子钰
面向 AIGC 的教育情景规划 / 刘永谋、王春丽
培育“人工智能观”:教学实践与有效性依据 / 黄劲草、朱恬骅
■ 基础设施
古籍方志物产领域知识图谱构建与应用研究 / 赵文娟、包平、徐晨飞、林立涛
从数据聚合到数字素养——数字人文视角下艺术图像库建设的现状与展望 / 贾力、汪燕翎
■ 文本分析
基于 LDA 主题模型的中国高校期刊文本挖掘研究(1912—1978)——以数学文章为考察中心 / 张家璇、陈镱文、张钰
文化地理学视角下《道德经》英译本的数字人文探索 / 张旭冉
■ 现地研究
苏轼南迁末段行程路线及创作系地考 / 郑腾尧
■ 概念与实践
数字化 / 安德鲁· 派博
可持续性与复杂性:数字人文中的知识与权威 / 约翰娜· 德鲁克
■ DHer 访谈
数字人文方法论、人文伦理与批判性教育——专访卡罗琳· 巴塞特教授 / 卡罗琳·巴塞特、江玉琴、姜慧玲
■ DH 资讯
《数字人文时代的语言、移民与多语问题》述介 / 程润峰
2024 IDEC 东亚古籍数字人文国际论坛综述 / 柳畅