为推动数字技术与人文社科深度融合,上海海事大学外国语学院于2025年5月26日至30日举办“数字人文学术周”活动。本次活动以自然语言处理(NLP)、数字人文(DH)、自然语言理解(NLU)与生成(NLG)为核心,邀请比利时根特大学Véronique Hoste教授与Els Lefever教授担任主讲嘉宾,通过“理论讲授+工具实操+案例研讨”的立体模式,以线上线下结合的形式,为200余位校内外学员呈现了一场跨学科的学术盛宴。
第一天的课程主题是NLP基础理论与方法论,Véronique教授以“自然语言处理的基本术语与历史”为开篇,系统阐释了术语标准化对机器翻译的重要性。下午实践应用环节Els教授以“语料库的价值”为主题,通过正则表达式实战训练学员的文本处理技能。Véronique教授带领学员开展“语料标注与标注者一致性评估”实操。 晚间课程为机器学习入门,Véronique教授以“机器学习基础”工作坊收尾。
第二天的主题是数字人文的技术与应用。Els教授进行技术框架解析,Véronique教授聚焦“统计与神经语言模型”,进行应用场景探索。晚间的专题讲座由Els教授讲授《从泥板到手稿:用NLP连接古代世界》,分析古代语言处理的挑战与实际案例。
第三天的主题是自然语言理解与事实建模。Els教授系统地讲解了术语管理的“收集-描述-组织-应用”流程。Véronique教授以“文本复杂度评估”为切入点,指导学员用Python构建语料库并训练模型。第四天的主题是“从自然语言理解到生成”,两位教授主要讲解情感分析的分类方法和分析过程。第五天主要进行前沿议题的讨论与伦理反思。
通过五天的密集学习,学员们普遍表示收获颇丰。未来,学院将继续推进“AI+语言服务”“大数据与翻译研究”等方向的学术探索,培养复合型人才。