LLM入門
合計 2 件の記事があります。
現在 1 ページ中の 1 ページ目です。
4.2 LLMの推論速度を最適化する方法|バッチ推論と半精度推論の活用
LLMの推論速度を改善するための技術を解説。バッチ推論、ONNX Runtime、半精度推論(FP16)など、効率的な推論手法とその実装例を紹介します。
2024-11-14
4.0 LLMのモデル圧縮と推論速度の最適化|効率的なパフォーマンス改善
LLMのモデル圧縮技術と推論速度の最適化手法を解説。量子化、知識蒸留、ONNXを使用したPython実装例で効率的なLLMのデプロイをサポート。
2024-11-12
カテゴリー
検索履歴
会話履歴 5085
LLM 967
大規模言語モデル 826
言語モデル 804
生成型要約 769
GPT-2 テキスト生成 737
注意メカニズム 729
GPT テキスト生成 716
NLP トランスフォーマー 710
エンジニア向け 700
マルコフ連鎖 699
教育AI 698
バイアス 問題 696
LLM テキスト生成 691
クロスエントロピー損失 687
LLM 要約 680
データ前処理 680
トレーニング 678
バッチサイズ 675
パーソナライズドコンテンツ 672
トークン化 661
自動要約 653
数学的アプローチ 649
ロス計算 644
ミニバッチ学習 637
コード生成 628
LLM リアルタイム処理 627
セルフアテンション 625
線形代数 617
FAQシステム 616
チーム
任 弘毅
株式会社レシートローラーにて開発とサポートを担当。POSレジやShopifyアプリ開発の経験を活かし、業務のデジタル化を促進。
下田 昌平
開発と設計を担当。1994年からプログラミングを始め、今もなお最新技術への探究心を持ち続けています。