专注于sentencebert,我们找不到直接针对代码微调的模型。所以解决方案有两种: 1、使用BERT模型来embedding,但是计算相似度的时候需要注意下面这一点: [https://peaceful0907.medium.com/sentence-embedding-by-bert-an...](https://link.segmentfault.com/?enc=bioqqk9zwKKKxtOOV4teRA%3D%3D.OEZEvpggNtto0jDJVTJgla%2B6MWU%2FMi0R35HIqH5dUwDLW%2F5cEoKNGjruor43P6iqnzEpl%2FlCMhhUybQQ0jdqrU7io5bALkLCqOBskuFOQqbFLA%2BgS%2BjigXvj3DA59Nag) 2、使用sentencebert,但是直接使用跨语言的模型。但是这样会导致计算语义相似度时性能的下降。