Blogs

Zenn

2026-05-21

ローカルLLMの「感情知能」を測る — EQ-Bench 3 で Qwen3.5-122B(int4) をベンチマーク

はじめに LLM の評価といえば MMLU や GSM8K のような知識・推論ベンチマークが定番ですが、「対人的な機微をどれだけ読めるか」「…

Zenn

2026-04-12

Groq × DPO で「ひらがなだけで答える LLM」をつくる - 合成データ生成から学習・評価まで -

はじめに LLM に「ひらがなだけで答えて」と指示しても、漢字やカタカナが混ざった回答が返ってくることはよくあります。これは、子ども向け教育…

Zenn

2026-04-08

RunPod H100×2でQwen3-Omniをデプロイする

はじめに Qwen3-Omni-30B-A3B-Instructは、Alibaba Cloudが開発したネイティブomniモーダルモデルです…

Zenn

2026-04-02

リモートアクセスしているDGX SparkでのNemoClawのセットアップ

はじめに NVIDIA が公開している AI エージェントフレームワーク NemoClaw を、Tailscaleを使ってリモートアクセスし…

Zenn

2026-02-26

【MLflow】Tailscale + AWS EC2/S3で作る、セキュアなLLM学習管理環境の構築ガイド

はじめに LLM（大規模言語モデル）のファインチューニングを行う際、実験ごとのハイパーパラメータやLossの推移、モデルの保存（Artifa…

Zenn

2026-02-26

【MLflow】Tailscale + AWS EC2/S3で作る、セキュアなLLM学習管理環境の構築ガイド

はじめに LLM（大規模言語モデル）のファインチューニングを行う際、実験ごとのハイパーパラメータやLossの推移、モデルの保存（Artifa…

Zenn

2026-02-04

DGX Spark（sm_121）でtorchaudioを動かす

はじめにはじめまして！2024年10月から株式会社Quixotiksでインターンをしている深澤です。現在は NVIDIA DGX Spa…

Zenn

2026-02-04

DGX Spark（sm_121）でtorchaudioを動かす

はじめにはじめまして！2024年10月から株式会社Quixotiksでインターンをしている深澤です。現在は NVIDIA DGX Spa…

Tech

2026-01-06

DGX SparkでDocker+GPUを用いてtorchaudioを動かす方法

はじめまして！2024年10月から株式会社Quixotiksでインターンをしている深澤です。現在は NVIDIA DGX Spark を使用して音声認...

Tech

2025-10-29

日本人・東アジア人特化の表情データセット

日本人（アジア人）や高齢者に特化したデータセットにはどのようなものがあるのかを調査しまとめました。

Tips

2025-10-14

AIは"おじいちゃんの渋い顔"をどう解釈する？VLMの表情認識をアジア人高齢者で検証

データセットの「外れ値」とも言えるアジア人（日本人）・高齢者の表情認識について、最新のVLMがどのような精度を示すのか検証してみることにしました

2025-10-03

VLMは人の表情をどう記述する？GeminiとGPT-4oで比較実験

モデルに人の表情を記述させることで、そもそも顔を認識できていない」のか、それとも「顔は認識できているが、表情の微妙なニュアンスを分類できていない」のかを明らかにすることを目指しました。

LLM

2025-09-25

In the Wildのデータセットで表情分類

前回調査したIn the Wildデータセットを使って、最新のVLM（Vision-Language Model）であるGeminiとGPTがどこまで表情認識できるのか、その実験結果を報告します。

tips

2025-09-22

"In the Wild"・動画の表情認識データセット

こんにちは、Quixotiksインターンの浅沼です。今回も顔表情認識（Facial Expression Recognition, FER）に関する技術サーベイの報告を行います。

2025-08-16

表情認識データセットの代表的な分類：Controlled と In the Wild

これまでリサーチ業務に携わってきましたが、そのサーベイ内容をこれから記事にして共有していきたいと思います。

Contact Us

お問い合わせ