外国语学院精心策划并成功举办的“2024语言·数据·翻译学术训练营”,犹如一股强劲的学术东风,极大地激发了本校师生和来自五湖四海的异地学子对于语言学、数据科学与翻译技术交叉融合的浓厚兴趣与深入探讨的热情,使得学院的学术氛围达到了前所未有的高潮。
自本周一,即2024年9月9日这一充满活力与期待的起点起,为期五天的训练营便以它独有的魅力与深度,循序渐进地引领着参与者们遨游于知识的海洋。转眼间,训练营已步入精彩的第三天,活动进入一个更为专业、深入的层次,也见证了学员们从理论初探到实践探索的华丽蜕变。
图一:Sharoff教授正在上课
9月11日上午和下午,来自英国利兹大学的知名教授Serge Sharoff继续带来了题为《Linguistic Annotation》的专题讲座。Sharoff教授以其深厚的学术造诣引领我们深入探索了文本智能处理的精髓。他不仅系统地阐述了文本分类与POS(词性标注)的核心原理,更以Python语言为媒介,生动展示了如何通过Transformer这一革命性的预训练语言模型,在命名实体识别与词性标注领域实现精准高效的处理。Sharoff教授的讲解,不仅让我们领略到了自然语言处理技术的无限可能,更激发了我们对复杂语言现象深度解析的热情与信心。同时,Serge教授以敏锐的洞察力,剖析了语料库应用中常见的false positives与false negatives等误差类型,通过详实的案例与直观的图表,使我们深刻认识到数据清洗与验证的重要性,为后续的研究工作奠定了坚实的基础。
伴随午后阳光的倾洒,Sharoff教授转而聚焦于网络文本数据的宝藏挖掘,为我们描绘了一幅将海量、非结构化的网络数据转化为语言研究与教学宝贵资源的壮丽图景。他详尽阐述了如何利用Web站点、XML文档等多样化的信息源,结合锚点技术,精准提取并整合这些数据,为自然语言处理乃至更广泛的人工智能领域注入新的活力。Sharoff教授进一步拓展了视野,分享了自建语料库的实用技巧,为外语学习者点亮了一盏明灯,预示着掌握这一前沿技术将成为他们未来学习与职业生涯中的重要助力。现场反响热烈,同学们纷纷跃跃欲试,积极参与讨论,共同见证了知识的力量与技术的魅力。
图二:Sharoff教授与同学探讨问题
尤为值得一提的是,下午的讲座还深刻探讨了人工智能与职业译员之间的未来共生关系。Sharoff教授以高瞻远瞩的视角,审视了机器翻译、大型语言模型(LLMs)等技术的飞速发展对翻译行业的影响,既直面了业界对于“机器超越人类”的担忧,又理性地指出了LLMs在理解人类语言复杂性与文化语境方面的局限性。他强调,未来的翻译世界将是人类智慧与AI技术相互融合、共同进步的舞台,LLMs与人类翻译的专业知识将形成强大的互补效应,携手克服语言障碍,推动全球交流的深化与发展。这一观点不仅为翻译职业的未来描绘了充满希望的前景,也激励着我们每一位在场的师生及线上观众,勇于拥抱变革,不断探索未知,为语言与文化的桥梁建设贡献自己的力量。
图三:Sharoff教授正在上课
之后,本次训练营还将继续深入研究探讨基于Hugging Face的大模型应用,以及其它领域的研究成果分享。敬请期待。