データサイエンス力 ランダム45問出題

データサイエンス力 ランダム45問出題

データサイエンス力のスキルカテゴリ全231問から45問をランダムに出題します。

1 / 45

Category: データサイエンス力

1) 「子ども」と「成人」の2つのカテゴリーを持つ変数をダミー変数に変換する場合、どのように設定するか

2 / 45

Category: データサイエンス力

2) 実験計画法において、結果に影響を与える可能性のある因子とその水準を変化させて解析する際、基本的な分析方法として用いられるのは次のうちどれか

3 / 45

Category: データサイエンス力

3) データ可視化における層化の目的は次のうちどれか

4 / 45

Category: データサイエンス力

4) ベクトルの要素(成分)とは次のうち何を指すか

5 / 45

Category: データサイエンス力

5) データセットの分散が16である場合、標準偏差は次のうちのどれか

6 / 45

Category: データサイエンス力

6) 画像データの前処理で、画像の特定の部分だけを残して他を削除する処理は次のうちどれか

7 / 45

Category: データサイエンス力

7) ある検査が陽性であった場合、その人が実際に病気である確率は次のうちどれか
以下の情報を考慮してください。

・病気の人が検査で陽性と判定される確率: 98%

・健康な人が検査で陰性と判定される確率: 90%

・実際の罹患率: 5%

8 / 45

Category: データサイエンス力

8) 連続型確率分布について正しいものはどれか

9 / 45

Category: データサイエンス力

9) 時系列データ分析において、季節変動を考慮することの重要性は次のうちどれか

10 / 45

Category: データサイエンス力

10) 標準正規分布において、確率変数Zが0以上の値を取る確率は次のうちどれか

11 / 45

Category: データサイエンス力

11) ダイエットプログラムの効果を検証するために、参加者の体重をプログラム開始前と終了後で比較します。この場合に使用する統計検定はどれか

12 / 45

Category: データサイエンス力

12) 9人の選手からキャプテンと副キャプテンを選ぶ方法は何通りあるか

13 / 45

Category: データサイエンス力

13) データ濃度について正しい記述は次のうちどれか

14 / 45

Category: データサイエンス力

14) 過学習を防ぐために用いられる学習方法は次のうちどれか

15 / 45

Category: データサイエンス力

15) 時系列データ分析において、データの周期性を無視してモデルを構築すると、どのような問題が生じる可能性があるか

16 / 45

Category: データサイエンス力

16) 回帰分析において、予測値と実測値の差の二乗の平均にルートを付けた評価指標はどれか

17 / 45

Category: データサイエンス力

17) 次の記述のうち、行列の積に関して正しいものどれか

18 / 45

Category: データサイエンス力

18) ゼロベクトルとはどのようなベクトルか

19 / 45

Category: データサイエンス力

19) ある病気に対する新しい検査方法が開発されました。この検査方法によると、病気の人が陽性と判定される確率は97%、健康な人が陰性と判定される確率は99%です。この地域の病気の罹患率が2%の場合、陽性と判定された人が実際に病気である確率はどれくらいか

20 / 45

Category: データサイエンス力

20) モデルの複雑さに対する罰則をかけることは次のうちどれか

21 / 45

Category: データサイエンス力

21) 母集団のデータを全て収集することが不可能な場合、通常どのようにして母集団の特性を推定するか

22 / 45

Category: データサイエンス力

22) 単回帰分析において、説明変数と目的変数の関係性を表現する式は次のうちどれか

23 / 45

Category: データサイエンス力

23) ヒストグラムについての説明として最も適切でないものはどれか

24 / 45

Category: データサイエンス力

24) 間隔尺度と比例尺度の違いを最もよく表しているのはどれか

25 / 45

Category: データサイエンス力

25) ボロノイ図についての説明として正しいものはどれか

26 / 45

Category: データサイエンス力

26) 係り受け解析についての説明として正しいものはどれか

27 / 45

Category: データサイエンス力

27) 画像データのフォーマットによって、次のうちどの要素が大きく異なるか

28 / 45

Category: データサイエンス力

28) 欠損値の扱いについて正しいのはどれか

29 / 45

Category: データサイエンス力

29) ホールドアウト法において、ハイパーパラメータの調整を行うために使用されるデータセットは次のうちどれか

30 / 45

Category: データサイエンス力

30) 2つの母集団の分散が異なると仮定する場合に使用するt検定はどれか

31 / 45

Category: データサイエンス力

31) クロス集計表を作成する目的は次のうちどれか

32 / 45

Category: データサイエンス力

32) ピアソンの相関係数は次のどのようなデータに対して計算することが適切か

33 / 45

Category: データサイエンス力

33) 以下のデータセット {3, 3, 4, 5, 5, 5, 6, 7, 7, 7, 7} の最頻値はいくつか

34 / 45

Category: データサイエンス力

34) LLMはどのようなビジネス活用が可能か

35 / 45

Category: データサイエンス力

35) 教師なし学習において、データのグループ分けを行う手法は次のうちどれか

36 / 45

Category: データサイエンス力

36) ヒストグラムの利点に関する記述として正しいものはどれか

37 / 45

Category: データサイエンス力

37) ダイエットプログラムによる体重の変化を検証する際、帰無仮説として適切なのはどれか

38 / 45

Category: データサイエンス力

38) AIネットワークシステムの動作の説明可能性を確保するために総務省が謳っている原則は次のうちどれか

39 / 45

Category: データサイエンス力

39) 信頼度90%、95%、99%の信頼区間についての説明として最も適切なものはどれか

40 / 45

Category: データサイエンス力

40) 次のデータセット {1, 2, 2, 3, 3, 3, 4, 4, 4, 4} の最頻値はいくつか

41 / 45

Category: データサイエンス力

41) データセットをランダムに分割して学習データを生成する方法の一つは次のうちどれか

42 / 45

Category: データサイエンス力

42) 統計的仮説検定における棄却域とは何を指すか

43 / 45

Category: データサイエンス力

43) 機械学習モデルが新しいデータに対してどれだけ適切に機能するかを示す指標は次のうちどれか

44 / 45

Category: データサイエンス力

44) ある学校で、生徒が数学のテストで80点以上を取る確率は0.6です。数学と英語の両方で80点以上取る確率は0.42でした。数学で80点以上を取った生徒が英語でも80点以上を取る条件付き確率はどれか

45 / 45

Category: データサイエンス力

45) 多重共線性を発見するためには、どのような手法を用いることができるか

0%