データエンジニアリング力 ランダム35問出題
データエンジニアリング力のスキルカテゴリ全196問から35問をランダムに出題します。
1 / 35
Category: データエンジニアリング力
1) Jupyter NotebookとRStudioの共通点は次のうちどれか
両方の開発環境は、分析に必要なライブラリが最初からパッケージされており、短時間で分析環境を準備できます。
2 / 35
2) データクレンジングにおける除外処理の目的は次のうちどれか
除外処理は、分析に不要なデータを取り除き、データセットの品質を向上させるために行われます。
3 / 35
3) Webクローラー・スクレイピングツールに関する説明として、最も適切なものを選べ
Webクローラー・スクレイピングツールは、インターネット上に公開されているWebページの情報を収集するためのプログラムやツールのことです。
4 / 35
4) データ分析において、次のうち第一四分位数を表すのはどれか
第一四分位数はデータセットを小さい順に並べたときの下から25%の位置にある値です。これはデータセットの下位の特徴を理解するのに役立ちます。
5 / 35
5) Jupyter Notebookで作成したファイルに含まれるものとして、適切なものはどれか
Jupyter Notebookでは、ソースコード、実行結果、図表、文書などを1つのファイルに保存できます。
6 / 35
6) 次のうち、構造化データの例として最も適切でないものはどれか
構造化データは「列」と「行」の概念で表せるデータのことを指し、Excelのスプレッドシートやリレーショナルデータベース、JSONフォーマットのデータが該当します。自然言語の文章は非構造化データの一例です。
7 / 35
7) 電子署名において、受信者が行う最初のステップは次のうちどれか
受信者は、まず添付された電子署名を送信者の公開鍵を用いて復号し、ハッシュ値を取得します。これにより、送信者が誰であるかを確認できます。
8 / 35
8) 正規表現でA000など数値が3桁以上の場合を拾う表現はどれか
A000など数値が3桁以上の場合を拾うには、A[0-9]{3,}と指定します。ここで、{3,}は3回以上の繰り返しを意味します。
9 / 35
9) SOAPを利用したWebサービスの特徴として、最も適切でないものはどれか
SOAPは、HTTPやHTTPSなどのプロトコルに依存せずに利用でき、セキュリティが高く、XMLベースのプロトコルです。しかし、SOAPはリアルタイムでのデータ交換にも利用されており、この選択肢はSOAPの特徴として最も適切でないものです。
10 / 35
10) グラフの色使いに関する正しい記述は次のうちどれか
グラフにおいて色は、データのカテゴリを区別し、視覚的に理解しやすくするための重要な要素です。色の使い方は慎重に行い、混乱を避けるために同じ色を異なるカテゴリに使用しないようにします。
11 / 35
11) 公開鍵認証基盤(PKI)の利点は次のうちどれか
公開鍵認証基盤(PKI)の利点は、通信相手の身元を確認できることです。これにより、データ通信の安全性が向上します。
12 / 35
12) HBaseはどのようなタイプのデータベースか
HBaseは、列ファミリーベースの分散データベースであり、Hadoop関連技術のHDFS上に構築されています。大規模なデータに対してリアルタイムに読み書きする処理に特化しています。
13 / 35
13) データに「カンマ」が含まれている場合、CSVフォーマットでのエクスポートにおいて注意すべき点は次のうちどれか
データに「カンマ」が含まれている場合、CSVフォーマットでエクスポートすると、意図しない形でデータが読み込まれる可能性があります。これは、CSVがコンマをフィールドの区切りとして使用するためです。
14 / 35
14) ハッシュ関数の特徴についての説明で、正しいものは次のうちどれか
ハッシュ関数は、元のデータからハッシュ値を生成する際に非可逆的な特性を持っています。これは、生成されたハッシュ値から元のデータを復元することができないことを意味します。
15 / 35
15) アドウェアがコンピュータに与える主な影響は次のうちどれか
アドウェアは、ユーザーの望まない迷惑な広告を表示するマルウェアの一種です。これにより、ユーザー体験が損なわれ、プライバシーの侵害やセキュリティリスクが生じることがあります。
16 / 35
16) SQLでテーブルを作成する際に使用する文は次のうちどれか
テーブルを作成するにはCREATE文を使用します。INSERTはデータの挿入、SELECTはデータの選択、DELETEはデータの削除に使います。
17 / 35
17) BIツールの主な目的は次のうちどれか
BIツールは、さまざまなデータを集約し、一目でわかるように分析するためのツールです。データの「見える化」により、意思決定を支援します。
18 / 35
18) 次のうち、データ結合処理において最も推奨される手順はどれか
データ結合処理においては、まず少ないデータ量で結果を確認し、問題なければ全量で処理をするという手順が最も推奨されます。これは、結合処理の書き方に少し間違いがあるだけで、データを抽出するDBに大きな負荷をかけてしまうことを防ぐためです。
19 / 35
19) Pythonで次のコードを実行した場合、出力される値は次のうちどれか
このPythonコードでは、変数 c と d にそれぞれ10と5が格納されています。print 関数で計算される式は
c
d
print
(10+5)×2
で、結果は30になります。
20 / 35
20) 公開鍵認証基盤(PKI)において、ユーザーの公開鍵と身元情報を関連付けるために必要なものは次のうちどれか
認証局はデジタル証明書を使用して、ユーザーの公開鍵と身元情報を関連付けます。これにより、通信相手が信頼できるかを確認できます。
21 / 35
21) 情報セキュリティのCIAのうち、ファイアウォールの設置が関連する要素はどれか
ファイアウォールは不正アクセスを防ぐために使用され、機密性を高める対策です。
22 / 35
22) データベースから抽出したデータをExcelで加工した後、元のデータベースにどのような影響があるか、次の中で最も適切なものを選べ
抽出されたデータをExcel上で加工したとしても、元のデータベースには反映されないので注意が必要です。
23 / 35
23) 次のうち、完全性(Integrity)に関連しないものはどれか
完全性はデータが正確で完全であることを保証する要素です。アクセス権限制御は機密性に関連する対策であり、完全性とは直接関係ありません。
24 / 35
24) Hadoopのデータ処理の仕組みは次のうちどれか
MapReduceはHadoopのデータ処理モデルで、大規模データの分散処理を行うためのプログラミングモデルです。
25 / 35
25) オープンデータの利用が推進される理由として、最も適切なものを選べ
オープンデータの利用が推進される主な理由は、データ利用による経済的価値の創出とイノベーションの促進です。秘密保持の強化や権利の強化、法律の複雑化は、オープンデータの目的とは異なります。
26 / 35
26) スパイウェアの主な目的は次のうちどれか
スパイウェアは、ユーザーの行動を秘密裏に監視し、個人情報や機密データを盗むことを目的としたマルウェアです。
27 / 35
27) ウォームスタンバイに関する説明として、次の中で最も適切なものを1つ選べ
ウォームスタンバイは、最小限のOSなどのみを起動しておくような、ホットスタンバイとコールドスタンバイの中間的な構成です。
28 / 35
28) データセットの中で最も多く出現する値、つまり最頻値を求めるためには、PythonのPandasライブラリではどの関数を使用するか
Pandasライブラリのmode()関数はデータセットの中で最も頻繁に出現する値、すなわち最頻値を求めるために使用されます。
29 / 35
29) JSONフォーマットでデータをエクスポートする利点は次のうちどれか
JSONフォーマットはデータの構造が柔軟であり、階層的なデータも扱いやすいため、多くのプログラミング言語でのデータ交換に適しています。
30 / 35
30) データベースにデータを挿入する際に、NOT NULL制約があるカラムに対してどのようなデータを挿入する必要があるか
NOT NULL制約があるカラムには、NULL値を挿入することはできません。そのため、非NULL値を挿入する必要があります。
31 / 35
31) Webクローラー・スクレイピングツールの使用時に注意すべき点は次のうちどれか
Webクローラー・スクレイピングツールを使用する際には、対象のWebサーバーに過度な負荷をかけないように注意する必要があります。
32 / 35
32) サーバーの構成においてクラスタリングが行われる2つの目的の記述として最も適切なものを1つ選べ
クラスタリングは、システム全体の性能を高める「拡張性」と、システム稼働を継続させる「高可用性」の2つの目的のために行われます。
33 / 35
33) アプリケーションレベルのアクセス権限で、ユーザーがデータベース内の特定のデータのみを参照できる権限はどれか
制限付き参照権限を持つユーザーは、アプリケーションの制御下で特定のデータのみを参照することができます。
34 / 35
34) SQLで複数のテーブルを結合する際に使用するキーワードとして適切なものはどれか
複数のテーブルを結合するにはJOINキーワードを使用します。UNIONは異なるテーブルの結果セットを結合するのに、GROUP BYは集約関数とともに使用し、ORDER BYは結果セットの並び替えに使います。
35 / 35
35) サーバーがクライアントに対して、レスポンスのデータ形式を伝えるために使用するHTTPヘッダーはどれか
Content-Typeヘッダーは、サーバーがクライアントにレスポンスのMIMEタイプを伝えるために使用されます。これにより、クライアントは受け取ったデータを適切に処理することができます。
Restart quiz