データエンジニアリング力 ランダム35問出題
データエンジニアリング力のスキルカテゴリ全196問から35問をランダムに出題します。
1 / 35
Category: データエンジニアリング力
1) ファイアウォールはどのレベルのアクセス制御に使用されるか
ファイアウォールはネットワークレベルのアクセス制御に使用され、不正なアクセスや攻撃からネットワークを保護します。
2 / 35
2) オープンデータの特徴として最も適切なものを選べ
オープンデータは、誰でも利用できることが特徴です。利用者が限定されていたり、データが暗号化されていたり、利用に料金が発生することは、オープンデータの特徴には当てはまりません。
3 / 35
3) 動的コンテンツの収集が難しい理由として最も適切なものをえらべ
動的コンテンツはユーザーのアクションやリクエストに応じて内容が変化するため、収集が難しいとされています。
4 / 35
4) データベース全体のバックアップを取る方法とは、次の中でどれか
フルバックアップはデータベース全体のバックアップを取る方法で、これ1つでデータ復元(リストア)することができます。非常に簡便ですが、バックアップに時間がかかるというデメリットがあります。
5 / 35
5) DWHアプライアンスの特徴として、一般的なRDBMSと比較して正しいものはどれか
DWHアプライアンスは、大量のデータを高速に処理するために設計されており、特にデータの結合・集計・抽出における処理能力に特化しています。一般的なRDBMSとは異なり、トランザクション処理には向いていません。
6 / 35
6) セルフBIの特徴として正しくないものは次のうちどれか
セルフBIはIT部門ではなく、ユーザー自身が管理し、レポート作成やデータ分析を行います。
7 / 35
7) 分散技術において、ノード数を増やすことで得られるメリットとして最も適切なものはどれか
分散技術では、ノード数を増やすことで処理性能を上げることができます。
8 / 35
8) 次のうちJupyter Notebookのどの機能がデータ分析を容易にするか
Jupyter Notebookのインタラクティブな実行結果は、データ分析を段階的に進めるのに役立ちます。
9 / 35
9) 大量のデータを効率的に処理するために必要な技術は次のうちどれか
データマイニングは、大量のデータから有用な情報を抽出する技術です。データエントリーは情報入力の作業、データベースインデックスは検索を高速化するためのもの、プログラムのデバッグはエラーを修正する過程です。
10 / 35
10) 次のうち、Excelでのデータ結合処理に最も頻繁に使用される関数はどれか
Excelでのデータ結合処理においては、VLOOKUP関数が最も頻繁に使用されます。この関数は、2つのデータを結合する際に多用されます。
11 / 35
11) 第二正規化において解消されるべきはどのような状態か
第二正規化は、第一正規化が行われた状態で、部分関数従属を解消することを目的としています。
12 / 35
12) 共通鍵暗号方式において、送信者と受信者が使用する鍵に関する説明として最も適切なものはどれか
共通鍵暗号方式では、データの暗号化と復号に同一の鍵を使用します。このため、送信者と受信者は同じ鍵を共有し、その鍵を秘密に保つ必要があります。
13 / 35
13) 以下のサイトのうち、オープンデータを提供していないものはどれか
DATA.GO.JP、e-Stat、国土数値情報ダウンロードはオープンデータを提供していますが、Yahoo! JAPANはオープンデータの提供サイトではありません。
14 / 35
14) オープンデータの利用が可能なデータの例として、最も不適切なものはどれか
オープンデータは、政府や自治体が提供する公開データのことを指します。特定企業の内部資料は、オープンデータとは異なります。
15 / 35
15) グラフの色使いに関する正しい記述は次のうちどれか
グラフにおいて色は、データのカテゴリを区別し、視覚的に理解しやすくするための重要な要素です。色の使い方は慎重に行い、混乱を避けるために同じ色を異なるカテゴリに使用しないようにします。
16 / 35
16) 次のうち、NoSQLデータストアの代表的なものとして最も適切でないものはどれか
Oracle Databaseは、一般的なリレーショナルデータベース管理システム(RDBMS)であり、NoSQLデータストアではありません。
17 / 35
17) Webクローラー・スクレイピングツールの使用時に注意すべき点は次のうちどれか
Webクローラー・スクレイピングツールを使用する際には、対象のWebサーバーに過度な負荷をかけないように注意する必要があります。
18 / 35
18) SQLでテーブルを作成する際に使用する文は次のうちどれか
テーブルを作成するにはCREATE文を使用します。INSERTはデータの挿入、SELECTはデータの選択、DELETEはデータの削除に使います。
19 / 35
19) 推移関数従属を解消する正規化の手法はどれか
推移関数従属を解消する正規化の手法は第三正規化です。これにより、データの冗長性をさらに減らすことができます。
20 / 35
20) データクレンジングの最初のステップとして最も適切なものはどれか
データクレンジングを行う前に、クレンジングの対象となるデータを抽出する必要があります。これにはフィルタリング処理のスキルが求められます。
21 / 35
21) Amazon S3はどのようなタイプのクラウドストレージサービスか
Amazon S3はオブジェクトストレージサービスであり、さまざまな形式のデータを蓄積できます。
22 / 35
22) データサイエンスにおける非構造化データの活用のハードルについての説明として、最も適切でないものはどれか
非構造化データは、関係性が明確でないため、分析や活用するためには前処理が必要であり、そのため活用のハードルが構造化データよりも高くなります。
23 / 35
23) 正規表現でA00~A99の文字列を表すとき、どの表現が最も適切か
A00~A99の文字列は、正規表現でA[0-9]{2}と表現します。ここで、[0-9]{2}は0から9までの数字が2回続くことを意味します。
24 / 35
24) マルウェアに感染したことを示す兆候は次のうちどれか
マルウェアに感染すると、ファイルが暗号化されてアクセスできなくなることがあります。これはランサムウェアの一般的な兆候であり、感染の警告信号となります。
25 / 35
25) 動的コンテンツに関する説明として最も適切なものを一つ選べ
動的コンテンツは、アクセスした際の状況に応じて異なる内容が表示されるWebページのことで、サーバー上で動的にHTMLファイルが生成されます。
26 / 35
26) SQLでテーブルを完全に削除するにはどの文を使用をするか
テーブルを完全に削除するにはDROP文を使用します。ERASE, REMOVE, CLEARはSQLの文ではありません。
27 / 35
27) サンプリング処理で重要なのは、どのようにして標本データを選ぶかです。最も適切な方法はどれか
サンプリング処理では、母集団からランダムにデータを選ぶことが重要です。これにより、バイアスのない、母集団を代表する標本データを得ることができます。
28 / 35
28) NoSQLデータストアのスケーラビリティに関する記述として正しいものはどれか
NoSQLデータストアは、ハードウェアの追加によって容易に拡張可能な高いスケーラビリティを持っています。これにより、大規模なデータを効率的に取り扱うことができます。
29 / 35
29) 電子署名を検証する際、受信者が使用する鍵は次のうちどれか
受信者は送信者の公開鍵を使用して電子署名を復号し、ハッシュ値を取得します。これにより、送信者が誰であるかとデータの完全性を確認できます。
30 / 35
30) データベースから外部にデータを抽出した後、元のデータベースが更新された場合、抽出したデータにどのような影響があるか、次の中で最も適切なものを選べ
データベースからのデータ抽出はコピーを作成する行為なので、元のデータベースがアップデートされたとしてもExcelには反映されず、再度データ抽出からやり直す必要があります。
31 / 35
31) BIツールの主な目的は次のうちどれか
BIツールは、さまざまなデータを集約し、一目でわかるように分析するためのツールです。データの「見える化」により、意思決定を支援します。
32 / 35
32) 次のうち、データ結合処理において最も重要なプロセスはどれか
データ結合処理においては、「単に結合処理ができる」というだけではなく、対象データを理解し、それに応じて適切な結合条件を設定できることが最も重要な視点です。
33 / 35
33) Google Cloud Storageの特徴は次のうちどれか
Google Cloud Storageは大量のデータ蓄積に適しており、非構造化データも扱えます。
34 / 35
34) 非正規化の状態にあるデータベースが抱える問題点として最も適切なものはどれか
非正規化されたデータベースでは、データの重複が多く発生し、それによってデータの冗長性が増加します。これはデータの不整合の原因となり得ます。
35 / 35
35) SQLでテーブルから特定の列を選択するにはどの文を使用するか
テーブルから特定の列を選択するにはSELECT文を使用します。PICK, CHOOSE, EXTRACTはSQLの文ではありません。
Restart quiz