IPPro:与维基媒体基金会的合作让Turnitin的技术实际应用于世界最大互联网信息库之一的英文维基百科在其间进行更大范围的侵犯著作权检测的意义有多大?维基百科社区高度重视”可核查性“,即任何文章内容和信息必须有已发表的可靠来源。Turnitin技术能够验证维基百科及其他电子资源比先前的范围更广的内容,让维基百科编辑们更有效地处理潜在的著作权问题。
Jason Chu:在数字世界,主要由于持续不断的超出人类管理能力的信息内容的涌现和内容验证、版权保护变得日益复杂。维基百科是全球最大的、全面的免费百科全书,而Turnitin在协助出版商保证其作品原创性方面处于领先地位。
IPPro:维基媒体基金会主要想通过Turnitin获得哪些效果?
Jason Chu:侵犯著作权检测的难点之一是太多网站镜像和/或复制维基百科的内容,噪点多且难以辨识原始资料来源。Turnitin技术关键在于能够有效比对维基百科的内容及镜像网站的内容。
也就是说,这是维基百科首选Turnitin查重系统的原因。
维基百科社区的Jake Orlowitz主动与Turnitin接洽,因为维基百科用来检测侵犯著作权的机器人程序并不能提供全面的内容覆盖,也没被大规模应用。先前使用的机器人程序不能比对维基百科文章内容与学术期刊及出版物的内容,而这是Turnitin的强项:覆盖了80%的世界前5000家期刊。这些都是维基百科选择使用Turnitin的原因。
就效果来说,Turnitin提供的机器人程序EranBot进行了广泛的测试,首先检测了与医疗有关的英文编辑内容,持续时间超过一年。测试完成后,经维基百科社区批准,EranBot用于检测所有英语文章的编辑内容。
IPPro:请问这些机器人能代替人工编辑吗?
Jason Chu:技术永远无法取代人类。这项技术仅完善人类的判断,更有效地整合并辨识问题点。EranBot和维基百科的其他机器人程序被用来识别那些问题点:文章内容或与外部、在线或已发表资源可能匹配的文章编辑内容。
维基百科的编辑们,即人类,拥有决定权,审查Turnitin提供的内容匹配报告,并确定这些内容的使用是否适当或是否侵犯著作权。该技术有助于更有效地、更容易地辨识上述内容。但是,该技术没有对此内容使用作出判断的能力,而人类有。
IPPro:著作权人的共同烦恼就是必须通过移除请求权亲自指出侵权行为,Turnitin技术如何帮助著作权人减轻这些负担?
Jason Chu:Turnitin提供的报告逐字地、清晰地突出显示与其他在线或已发表的资源相匹配的内容。Turnitin报告不仅指出匹配内容的来源,还显示根据其算法辨识出的所有匹配内容。报告内容全面,便于著作权人与潜在的侵权人沟通,通知并验证其权利主张。
IPPro:Turnitin与学校、学院就学生抄袭方面的合作如何?抄袭常见吗?贵司的技术如何帮助克服呢?
Jason Chu:我们看到,学生没有充分理解著作权,也不懂得负责任地使用获得的信息,如引用要恰当。学生们对著作权的理解多通过消费和共享在线信息获得。通过便于P2P交流的App和服务,互联网及网络促进、支持连接及共享,包括信息免费、自由分享的理念。
这种自由对促进在线参与及社会互动方面意义重大,但并适用于学术环境。在学术环境中,学生们需懂得,不标明来源、不谨慎对待信息本身的共享念头是不可行的。
学校和机构通过使用Turnitin技术,让学生思考如何将源材料加入文中,并审慎考虑所用资源。Turnitin报告作用巨大,可突出显示并反馈给学生,告知学生使用信息资源的方法、尊重原创和著作权。