用于代码理解和中文理解的SentenceBERT模型?-灵析社区

拽嘻嘻

请问各位,有没有用于以下两个场景的微调sentencebert模型呢? * 代码上下文理解,类似于codeBert * 中文文本理解,其实如果是直接的bert很多,但是sentencebert很少 这是我之前的尝试,找到了符合要求的bert模型,但我想要sentencebert 这是其中一个:[https://github.com/microsoft/CodeBERT](https://link.segmentfault.com/?enc=nb4z8FYtfuwsz0S%2BGKatwg%3D%3D.TqiMDWj70dxV4gRFpyANncfQ4lgcpaZ27DyHVqjBBpnq4eLdNnXrq2XiaAFhFxab)

阅读量:145

点赞量:0

问AI
专注于sentencebert,我们找不到直接针对代码微调的模型。所以解决方案有两种: 1、使用BERT模型来embedding,但是计算相似度的时候需要注意下面这一点: "https://peaceful0907.medium.com/sentence-embedding-by-bert-an..." (https://link.segmentfault.com/?enc=bioqqk9zwKKKxtOOV4teRA%3D%3D.OEZEvpggNtto0jDJVTJgla%2B6MWU%2FMi0R35HIqH5dUwDLW%2F5cEoKNGjruor43P6iqnzEpl%2FlCMhhUybQQ0jdqrU7io5bALkLCqOBskuFOQqbFLA%2BgS%2BjigXvj3DA59Nag) 2、使用sentencebert,但是直接使用跨语言的模型。但是这样会导致计算语义相似度时性能的下降。