データサイエンス力　ランダム45問出題│データサイエンティスト検定対策 WEB問題集・一問一答

データサイエンス力　ランダム45問出題

データサイエンス力のスキルカテゴリ全231問から45問をランダムに出題します。

1 / 45

Category: データサイエンス力

1) 定積分の値は次のうちどれか

2

1

0.5

1.5

2 / 45

Category: データサイエンス力

2) 画像識別AIモデルの学習効率を向上させるために行う処理は次のうちどれか

正規化

リサイズ

トリミング

パディング

3 / 45

Category: データサイエンス力

3) 教師なし学習において、データのグループ分けを行う手法は次のうちどれか

k-means法

サポートベクターマシン

決定木

ロジスティック回帰

4 / 45

Category: データサイエンス力

4) 散布図において、目的変数がある場合、縦軸には何を配置するのが適切か

目的変数

目的変数とは無関係なデータ

目的変数と関連が高い要因

目的変数と関連が低い要因

5 / 45

Category: データサイエンス力

5) データ分析においてダミー変数を使用する目的は次のうちどれか

データのバリエーションを増やすため

データセットのサイズを増やすため

予測モデルの精度を下げるため

質的変数を量的変数に変換するため

6 / 45

Category: データサイエンス力

6) 名義尺度に関する記述として最も適切なものはどれか

等号での比較ができない。

平均値の計算に意味がある。

等級や満足度の比較が可能。

数値は内容を区別するためだけに使用。

7 / 45

Category: データサイエンス力

7) 相関係数が1または-1に近い値を取るとき、どのような関係性が考えられるか

中程度の相関がある

強い相関がある

相関関係は存在しない

弱い相関がある

8 / 45

Category: データサイエンス力

8) クラスター分析におけるウォード法の特徴として正しいものはどれか

ウォード法はクラスター間の重心距離を基準にする。

ウォード法はクラスター内のデータ点の合計を最大化する。

ウォード法はクラスター間の最長距離を基準にする。

ウォード法はクラスター内のデータ点の分散を最小化する。

9 / 45

Category: データサイエンス力

9) モデルの複雑さに対する罰則をかけることは次のうちどれか

正則化

最適化

正規化

標準化

10 / 45

Category: データサイエンス力

10) 推測統計学は何を目的としているか

標本の特徴の記述

データの収集方法の決定

データの記述

母集団の特徴や情報の推測

11 / 45

Category: データサイエンス力

11) 相関係数が-0.4の場合、以下のうちどのような関係性が考えられるか

弱い負の相関がある

相関関係は存在しない

強い正の相関がある

強い負の相関がある

12 / 45

Category: データサイエンス力

12) 7冊の異なる本から3冊を選ぶ組み合わせは何通りあるか

210通り

35通り

105通り

21通り

13 / 45

Category: データサイエンス力

13) ある検査が陽性であった場合、その人が実際に病気である確率は次のうちどれか
以下の情報を考慮してください。

・病気の人が検査で陽性と判定される確率: 98%

・健康な人が検査で陰性と判定される確率: 90%

・実際の罹患率: 5%

約23%

約20%

約75%

約34%

14 / 45

Category: データサイエンス力

14) 学習データに対する誤差を何と呼ぶか

最小誤差

平均誤差

汎化誤差

訓練誤差

15 / 45

Category: データサイエンス力

15) CDの量子化ビット数は何ビットか

16ビット

32ビット

8ビット

24ビット

16 / 45

Category: データサイエンス力

16) 機械学習における「ロジスティック回帰」とは次のうちどれか

教師あり学習の予測手法

報酬を基に学習する手法

データのグループ分けを行う手法

教師あり学習の分類手法

17 / 45

Category: データサイエンス力

17) 標準正規分布の確率密度関数のグラフはどのような形をしているか

U字型の曲線

負の指数関数の形

正の指数関数の形

ベル型の曲線

18 / 45

Category: データサイエンス力

18) 非階層クラスター分析の特徴として正しいものはどれか

データ間の距離を全て測定する必要がある。

クラスターの数を事前に指定する。

樹形図を作成することが主な目的である。

計算量が多く、時間がかかる。

19 / 45

Category: データサイエンス力

19) MP3形式のファイルはどのような特徴があるか

データ量が大きい

音質が非常に高い

人間に聞こえる音のみを保存

すべての音波の情報を保存

20 / 45

Category: データサイエンス力

20) 関数の x = 1 での接線の傾きはどうなりますか？

0

無限大

-1

1

21 / 45

Category: データサイエンス力

21) 次のうち、Accuracy（正解率）を最も正確に説明しているのはどれか

負例と予測されたレコードのうち実測値が負例の割合

正例と予測されたレコードのうち実測値が正例の割合

実測値が正例のレコードのうち正例と予測された割合

正解のレコード数をすべてのレコード数で割った割合

22 / 45

Category: データサイエンス力

22) データインク比に関する次の記述のうち、最も適切なものはどれか

データインク比は、グラフの色の鮮やかさを決定します。

データインク比が高いほど、グラフは情報を多く含んでいます。

データインク比は、グラフにおける装飾的要素の割合を示します。

データインク比は、チャートの美しさを表す指標です。

23 / 45

Category: データサイエンス力

23) インフォデミックの原因として、以下のうち正しいものはどれか

エビデンスベーストの欠如

感情に基づく判断

データの過剰な分析

情報の過小評価

24 / 45

Category: データサイエンス力

24) 散布図において、データポイントが散らばっている場合、どのような関係性が示されるか

データ不足

負の相関

相関なし

正の相関

25 / 45

Category: データサイエンス力

25) 量的変数を質的変数に変換するプロセスは次のうちどれか

集約化

正規化

標準化

離散化

26 / 45

Category: データサイエンス力

26) 機械学習において、教師なし学習が主に活用されるのはどのような場面か

データのグループ分けや情報の要約が必要な場合

新しいデータに対する予測が必要な場合

正解ラベルが必要な場合

報酬を基に学習する場合

27 / 45

Category: データサイエンス力

27) 検定力が低いとはどういう状況を指すか

第2種の過誤を犯す確率が低い

帰無仮説を棄却する確率が高い

第1種の過誤を犯す確率が高い

第2種の過誤を犯す確率が高い

28 / 45

Category: データサイエンス力

28) スカラーとベクトルの違いは次のうちどれか

スカラーには大きさがない

ベクトルは大きさを持たない

ベクトルには方向がない

スカラーは方向を持たない数値

29 / 45

Category: データサイエンス力

29) 欠損値の扱いについて正しいのはどれか

欠損値は分析に影響を与えない

欠損値の多い変数は除外することを検討する

欠損値はデータの完全性を保証する

欠損値は常に無視してよい

30 / 45

Category: データサイエンス力

30) 標本分散を母分散の推定にそのまま使用すると何が起こるか

母分散の推定に影響しない

母分散が過大評価される

母分散が正確に推定される

母分散が過小評価される

31 / 45

Category: データサイエンス力

31) 時系列データを用いた予測モデル構築において、データの可視化が推奨される理由は次のうちどれか

データの周期性を数学的に証明するため

データの分布を正規分布に変換するため

データの欠損値を補完するため

データの基本的な構造や変化の特性を理解するため

32 / 45

Category: データサイエンス力

32) デジタル画像のサンプリング間隔が大きい場合、どのような問題が発生する可能性があるか

エイリアシングが減少する

ジャギーが現れる

画像のデータサイズが大きくなる

画像の色が薄くなる

33 / 45

Category: データサイエンス力

33) アクティブラーニングのプロセスには何が含まれるか

すべてのデータにタグ付けをする

データ全体にアノテーションを行う

教師なしデータからランダムにデータを選ぶ

教師データでモデルを構築し、効果的なデータを抽出する

34 / 45

Category: データサイエンス力

34) 標準正規分布の確率密度関数において、曲線の最高点はどこにあるか

Z = 0.00

Z = -1.00

Z = 2.00

Z = 1.00

35 / 45

Category: データサイエンス力

35) 重回帰分析における回帰係数が示すものとして正しいものはどれか

目的変数の予測値

各説明変数の重要性

説明変数の予測値

目的変数の実測値

36 / 45

Category: データサイエンス力

36) アンサンブル平均の説明として正しいのはどれか

時間属性を平均化したもの

同一条件下のデータの集合平均

ある時間帯の変化を平均したもの

異なる条件下のデータの集合平均

37 / 45

Category: データサイエンス力

37) データ可視化における層化の目的は次のうちどれか

データの量を減らすため

データをより鮮明にするため

データの保存を容易にするため

比較対象の差を見比べるため

38 / 45

Category: データサイエンス力

38) 検定の結果、帰無仮説を棄却しなかった場合に犯すことがある誤りは次のうちどれか

第四種の過誤

第一種の過誤

第二種の過誤

第三種の過誤

39 / 45

Category: データサイエンス力

39) 形態素解析についての説明として正しいものはどれか

形態素解析は文章を意味のある最小の単位に分割する。

形態素解析は文章をパラグラフに分割する。

形態素解析は文章を文節に分割する。

形態素解析は文章を意味のない小片に分割する。

40 / 45

Category: データサイエンス力

40) 実験計画法で用いられる直交表は、どのような目的で使用されるか

実験誤差を少なくするため

因子間の相関を高めるため

実験回数を削減するため

因子の水準を増やすため

41 / 45

Category: データサイエンス力

41) 過学習を防ぐために用いられる学習方法は次のうちどれか

交差検証法

強化学習法

教師なし学習法

逐次学習法

42 / 45

Category: データサイエンス力

42) ピアソンの積率相関とスピアマンの順位相関の違いの説明として、次のうち最も適切でない記述はどれか

ピアソンの積率相関は量的データに適用される。

スピアマンの順位相関は値の増加の幅も評価する。

スピアマンの順位相関は順位データの単調関係を評価する。

スピアマンの順位相関はピアソンの積率相関を用いて計算できる。

43 / 45

Category: データサイエンス力

43) 検定の結果、p値が0.05よりも小さい場合、通常どのように解釈されるか

対立仮説を棄却するには証拠が不十分である

帰無仮説を棄却するには証拠が不十分である

帰無仮説を棄却するには証拠が十分である

対立仮説を棄却するには証拠が十分である

44 / 45

Category: データサイエンス力

44) アソシエーション分析において、共起頻度が高いとはどのような意味か

事象Xと事象Yが全く関連していない

事象Xと事象Yが頻繁に同時に発生する

事象Xが発生した後に事象Yが発生する

事象Xと事象Yが互いに影響を与える

45 / 45

Category: データサイエンス力

45) 2値分類問題において、予測値が正例で実測値も正例である場合、これは何と呼ぶか

True Positive (TP)

True Negative (TN)

False Negative (FN)

False Positive (FP)

0%

データサイエンス力 ランダム45問出題

データサイエンス力　ランダム45問出題