感情分析は、ソフトウェア エンジニアリングで使用されるツールと、使用される API 推奨システムおよび関連ライブラリの適切な手がかりを提供できます。これに関連して、SentiCR、SentiStrength-SE などの既存のツールは、そのような戦略の展開の目的を完全に無効にする低い f1 スコアを示したため、パフォーマンスの改善の余地は十分にあります。最近の進歩は、トランスフォーマー ベースの事前トレーニング済みモデル (たとえば、BERT、RoBERTa、ALBERT など) がテキスト分類タスクでより良い結果を示していることを示しています。このコンテキストに従って、現在の調査では、さまざまな BERT ベースのモデルを調査して、GitHub コメント、Jira コメント、および Stack Overflow 投稿の文を分析します。この論文では、感情分析のために BERT ベースのモデルを分析するための 3 つの異なる戦略を示しています。最初の戦略では、BERT ベースの事前トレーニング済みモデルが微調整されます。 2 番目の戦略では、BERT バリアントからアンサンブル モデルが開発されます。 3 番目の戦略では、圧縮モデル (Distil BERT) が使用されます。実験結果は、BERT ベースのアンサンブル アプローチと圧縮 BERT モデルが、3 つすべてのデータセットで F1 測定の一般的なツールよりも 6 ~ 12% 向上することを示しています。
Sentiment analysis can provide a suitable lead for the tools used in software engineering along with the API recommendation systems and relevant libraries to be used. In this context, the existing tools like SentiCR, SentiStrength-SE, etc. exhibited low f1-scores that completely defeats the purpose of deployment of such strategies, thereby there is enough scope of performance improvement. Recent advancements show that transformer based pre-trained models (e.g., BERT, RoBERTa, ALBERT, etc.) have displayed better results in the text classification task. Following this context, the present research explores different BERT-based models to analyze the sentences in GitHub comments, Jira comments, and Stack Overflow posts. The paper presents three different strategies to analyse BERT based model for sentiment analysis, where in the first strategy the BERT based pre-trained models are fine-tuned; in the second strategy an ensemble model is developed from BERT variants; and in the third strategy a compressed model (Distil BERT) is used. The experimental results show that the BERT based ensemble approach and the compressed BERT model attain improvements by 6-12% over prevailing tools for the F1 measure on all three datasets.