お問い合わせ
Zenn
2026-02-26
【MLflow】Tailscale + AWS EC2/S3で作る、セキュアなLLM学習管理環境の構築ガイド
はじめに LLM(大規模言語モデル)のファインチューニングを行う際、実験ごとのハイパーパラメータやLossの推移、モデルの保存(Artifa…
2026-02-04
DGX Spark(sm_121)でtorchaudioを動かす
はじめに はじめまして!2024年10月から株式会社Quixotiksでインターンをしている深澤です。 現在は NVIDIA DGX Spa…
Tech
2026-01-06
DGX SparkでDocker+GPUを用いてtorchaudioを動かす方法
はじめまして!2024年10月から株式会社Quixotiksでインターンをしている深澤です。 現在は NVIDIA DGX Spark を使用して音声認...
2025-10-29
日本人・東アジア人特化の表情データセット
日本人(アジア人)や高齢者に特化したデータセットにはどのようなものがあるのかを調査しまとめました。
Tips
2025-10-14
AIは"おじいちゃんの渋い顔"をどう解釈する?VLMの表情認識をアジア人高齢者で検証
データセットの「外れ値」とも言えるアジア人(日本人)・高齢者の表情認識について、最新のVLMがどのような精度を示すのか検証してみることにしました
2025-10-03
VLMは人の表情をどう記述する?GeminiとGPT-4oで比較実験
モデルに人の表情を記述させることで、そもそも顔を認識できていない」のか、それとも「顔は認識できているが、表情の微妙なニュアンスを分類できていない」のかを明らかにすることを目指しました。
LLM
2025-09-25
In the Wildのデータセットで表情分類
前回調査したIn the Wildデータセットを使って、最新のVLM(Vision-Language Model)であるGeminiとGPTがどこまで表情認識できるのか、その実験結果を報告します。
tips
2025-09-22
"In the Wild"・動画の表情認識データセット
こんにちは、Quixotiksインターンの浅沼です。 今回も顔表情認識(Facial Expression Recognition, FER)に関する技術サーベイの報告を行います。
2025-08-16
表情認識データセットの代表的な分類:Controlled と In the Wild
これまでリサーチ業務に携わってきましたが、そのサーベイ内容をこれから記事にして共有していきたいと思います。