Skip to main content
wandb-japan
Projects
llm-leaderboard3
Reports
Log in
Sign up
Overview
Models
Workspace
Runs
More
Weave
Traces
Evals
Playground
Monitors
Assets
More
Anyone
Anyone
jcrawley
keisuke-kamata
yuya-yamamoto
Reports
Created by
Created On
Last edited
Nejumi LLMリーダーボード3
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
8
keisuke-kamata
2024-05-17
2 weeks ago
Clone report
Nejumi LLMリーダーボード3 (sarashina用)
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2025-07-16
2 months ago
Clone report
Weave: mtbench_leaderboard_table (25/07/01 10:10:58)
0
yuya-yamamoto
2025-07-01
2 months ago
Clone report
Weave: mtbench_leaderboard_table (25/07/01 09:11:26)
0
yuya-yamamoto
2025-07-01
2 months ago
Clone report
Weave: mtbench_leaderboard_table (25/07/01 02:57:37)
0
yuya-yamamoto
2025-06-30
2 months ago
Clone report
Copy of yuya-yamamoto's Nejumi LLMリーダーボード3
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2025-05-25
4 months ago
Clone report
GPT-4.5関連の質問について
0
yuya-yamamoto
2025-04-17
5 months ago
Clone report
Untitled Report
0
keisuke-kamata
2024-11-14
10 months ago
Clone report
Nejumi LLM Leaderboard3
Evaluate the Japanese language capabilities of prominent LLM models from the broad perspectives of language comprehension, application skills, and alignment
0
yuya-yamamoto
2024-06-28
10 months ago
Clone report
Nejumi LLMリーダーボード3, Cohere API vs Open weights
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2024-09-30
11 months ago
Clone report
Nejumi LLMリーダーボード3(量子化比較用)
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2024-07-02
1 year ago
Clone report
Weave: (empty) (24/07/29 17:24:24)
0
jcrawley
2024-07-30
1 year ago
Clone report
Copy of keisuke-kamata's Nejumi LLMリーダーボード3
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2024-07-18
1 year ago
Clone report
Nejumi LLMリーダーボード3 for Hayashi-san Review
注目のLLMモデルの日本語能力を言語理解能力・応用能力・アライメントの広い観点で評価
0
yuya-yamamoto
2024-06-24
1 year ago
Clone report