三 相关性问题
任何事情均是双方面的,现代化手段能解决一些问题,也会产生一些问题,如测试当中出现系统故障、无法录音等,当然更主要的是测评信度问题。
传统的测评方式需要测试员对应试人全部测试语料进行审听打分,这些测评项是一个整体,反映了应试人的整体普通话水平。如果采用机器辅助测试,测试员只评审“说话”一项,就缺乏系统的概念,整个普通话测试评分标准就需要全面颠覆,这也是需要直面的事实。因为语言本身的特殊性,采用机器辅助测试,目前有些问题仍然解决不了,其中最主要的是语言的模糊性与测试科学性的悖论问题:说话呈现的东西是很微妙的,方言、音质、环境、精神状态、生病、试卷、测试员、测试手段等都可能会影响测试结果,而测试工作则尽力使之科学化、量化、技术化,这是个深层性的悖论。这要求我们一方面要严谨科学认真,另一方面我们也不可教条,不可迷信技术手段,不能完全否定人的主观性介入的价值,是完全人测,还是人测机助,或是机测人助,这自然就又涉及人测好还是机器测好的问题。也就是说,有几个问题还是需要搞清楚的:普通话水平测试为了什么?是不是不需要测试员了?机器、技术能完全替代人吗?机器测试符合测试的性质、要求吗?这些都是需要进行整体研究的。
还有一个测试的严肃性问题。使用机器采集语料,让应试人面对计算机进行口语表达,本身就违背了口语测试需要面对面测试的原则,如真要采用面对机器的测试,也应该是远程的通过网络视频的现场测试。再者,当测试语料上传到服务器后,测试员随时随地在家里、办公室进行即时评分,但谁能保证测试员评分是在一个安静、没有干扰的情况下,专心致志地评分呢?你测评50个音节,去洗一下手;测一段朗读材料,接一个电话;听半分钟的“命题说话”,就给一个分数,这样的测评有严肃性、科学性吗?它完全颠覆了口语测试的形式和原则,没有经过论证,就能推而广之吗?
计算机辅助普通话水平测试研究将现代语音技术、计算机技术与普通话水平测试紧密结合,是近年普通话水平测试科研取得的一项重要成果,更是一项具有历史意义的科学研究。在确保测试质量,坚持规范管理,维护国家考试严肃性的前提下,积极开展机辅测试的研究与试点工作,对推动我国普通话水平测试与培训这一伟大事业具有非常重要的作用(韩玉华,2009)。但要实施计算机辅助测试,必须统筹解决几个关键性的问题:测试的信度与效度;测试的方式;评分标准;评分方法;质量监控;测试员。
免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。