题主的问题应该是"langid.py中的语言代码是什么含义".
依据langid.py在GitHub上的readme"langid.py comes pre-trained on 97 languages (ISO 639-1 codes given)"可知, langid.py分类出来的的语言标号依据ISO 639-1语言编码标准 .
查询百科词条ISO 639-1, 可知fa是波斯语的代号.
建议题主再遇到类似的问题时先尝试去找找所用项目的文档.
list查找时,需要遍历,这与其线性的存储结构有关,因此数据量大时,就显得慢了.且处于list中越靠后,查询越慢;不在list中,更需遍历所有元素,速度最慢. 而dict默认采用hash_map存储,即使数据量很大,查找也非常快速.
python没有strcmp函数不过有cmp不用导入直接用就行#strcmp(sStr1,sStr2) sStr1 ='strchr' sStr2 ='strch' print cmp(sStr1,sStr2)