+4

🛠️面接前に知っておきたかった16のシステム設計の概念💡

1. ドメインネームシステム (DNS)

1.1 DNS とは何か?

DNS は、インターネットの基本的な部分で、人間が読めるドメイン名(www.example.com など)をコンピュータが読める IP アドレス(192.0.2.1 など)に変換します。

1.2 DNS の仕組み

  • DNS クエリ: ユーザーが URL を入力すると、ブラウザは DNS クエリを DNS リゾルバに送信します。
  • ルートサーバ: リゾルバが情報を持っていない場合、クエリを DNS ルートサーバに転送し、適切な TLD サーバを指定します。
  • TLD サーバ: TLD サーバは、リゾルバを質問のドメインを管理する権威サーバに指示します。
  • 権威サーバ: 権威サーバは、リゾルバに対応する IP アドレスを提供します。
  • 応答: リゾルバは IP アドレスをブラウザに返し、ブラウザは目的のサーバーに接続します。

2. ロードバランサ

2.1 ロードバランサとは何か?

ロードバランサは、複数のサーバーにトラフィックを分散する装置またはソフトウェアです。これにより、アプリケーションのパフォーマンス、可用性、信頼性が向上します。

2.2 ロードバランシングの種類

  • ラウンドロビン: リクエストがサーバー間で均等に分散されます。
  • 最小接続: リクエストがアクティブ接続が最も少ないサーバーに送られます。
  • IP ハッシュ: クライアントの IP アドレスのハッシュに基づいてリクエストが割り当てられます。

3. API ゲートウェイ

3.1 API ゲートウェイとは何か?

API ゲートウェイは、クライアントとマイクロサービスの間にあるサーバーです。API ゲートウェイは、API リクエストを適切なマイクロサービスにルーティングし、システムの複雑さを隠蔽します。

3.2 API ゲートウェイの機能

  • リクエストルーティング: クライアントからのリクエストを適切なマイクロサービスに転送します。
  • 認証: クライアントのアクセス権を検証し、セキュリティを強化します。
  • レート制限: システムへのリクエスト数を制限し、過負荷を防ぎます。

4. コンテンツデリバリーネットワーク (CDN)

4.1 CDN とは何か?

CDN は、世界中のデータセンターにコンテンツをキャッシュすることで、ウェブコンテンツの配信速度を向上させるネットワークサービスです。

4.2 CDN の仕組み

  • エッジサーバー: CDN は、世界中のデータセンターにエッジサーバーを設置し、ユーザーに近い場所でコンテンツをキャッシュします。
  • リクエストルーティング: ユーザーがコンテンツにアクセスすると、CDN は最も近いエッジサーバーを選択してリクエストをルーティングします。

5. フォワードプロキシとリバースプロキシ

5.1 フォワードプロキシ

フォワードプロキシは、クライアントとインターネットの間にあるサーバーで、クライアントからのリクエストを適切なサーバーに送信します。フォワードプロキシは、ネットワーク制限を回避したり、セキュリティを向上させたり、帯域幅を節約するためにキャッシュを利用したりします。

5.2 リバースプロキシ

リバースプロキシは、インターネットとバックエンドサーバーの間にあるサーバーで、クライアントのリクエストを適切なサーバーに転送します。リバースプロキシは、負荷分散、セキュリティ向上、およびコンテンツの高速配信のためにキャッシュを利用できます。

6. キャッシング

6.1 キャッシングとは何か?

キャッシングは、頻繁にアクセスされるデータを効率的に格納・提供するための技術です。データのコピーをユーザーに近い場所に保存し、リクエストのレスポンス時間を短縮します。

6.2 キャッシュの種類

  • ブラウザキャッシュ: クライアント側のウェブブラウザにキャッシュされたコンテンツ。
  • CDN キャッシュ: エッジサーバーにキャッシュされたコンテンツ。
  • インメモリキャッシュ: サーバーのメモリにキャッシュされたデータ。例: Redis, Memcached。

7. データパーティショニング

7.1 データパーティショニングとは何か?

データパーティショニングは、データを複数の部分に分割して、処理速度と可用性を向上させる手法です。

7.2 パーティショニングの種類

  • ホリゾンタルパーティショニング: データを行単位で分割します。各パーティションには、全体のデータセットの一部が含まれます。
  • 垂直パーティショニング: データを列単位で分割します。各パーティションは、データセットの特定の列を含みます。

8. データベースレプリケーション

8.1 データベースレプリケーションとは何か?

データベースレプリケーションは、データを複数のデータベースサーバーにコピーするプロセスで、データの可用性、耐障害性、およびパフォーマンスを向上させます。

8.2 レプリケーションの種類

  • マスタースレーブレプリケーション: マスターサーバーがデータの変更を行い、スレーブサーバーがそれらの変更をコピーします。
  • マスターマスターレプリケーション: すべてのサーバーがデータの変更を行い、他のサーバーに変更を複製します。

9. 分散メッセージングシステム

9.1 分散メッセージングシステムとは何か?

分散メッセージングシステムは、アプリケーション間でメッセージを効率的にやり取りするためのシステムです。これにより、コンポーネント間の結合が緩やかになり、スケーラビリティと耐障害性が向上します。

9.2 一般的な分散メッセージングシステム

  • Apache Kafka: 高スループット、耐障害性、およびスケーラビリティに優れた分散ストリーミングプラットフォーム。
  • RabbitMQ: 高度にスケーラブルで信頼性のあるメッセージブローカ。

10. マイクロサービス

10.1 マイクロサービスとは何か?

マイクロサービスは、独立してデプロイ可能な小さなサービスにアプリケーションを分割するアーキテクチャスタイルです。これにより、開発、デプロイメント、スケーリングが容易になります。

10.2 マイクロサービスの利点

開発の促進: 小さなチームが独立して機能を開発できます。 スケーラビリティ: 個々のサービスを独立してスケールできます。 障害の局所化: システム全体ではなく、個々のサービスのみが影響を受けます。

11. NoSQL データベース

11.1 NoSQL データベースとは何か?

NoSQL データベースは、従来のリレーショナルデータベースと異なるデータモデルを採用しており、スケーラビリティと柔軟性に優れています。

11.2 NoSQL データベースの種類

  • キー・バリューストア: シンプルなキーと値のペアを格納するデータベース。例: Redis, Amazon DynamoDB。
  • ドキュメントストア: JSON や BSON などのドキュメント形式でデータを格納するデータベース。例: MongoDB, Couchbase。
  • カラムファミリーストア: カラムファミリー単位でデータを格納するデータベース。例: Apache Cassandra, HBase。
  • グラフデータベース: グラフ構造でデータを格納するデータベース。例: Neo4j, Amazon Neptune。

12. データベースインデックス

12.1 データベースインデックスとは何か?

データベースインデックスは、データベース内のデータを効率的に検索できるようにする構造です。インデックスを使用することで、クエリのパフォーマンスが大幅に向上します。

12.2 インデックスの種類

  • B-Tree インデックス: 一般的なインデックスで、リレーショナルデータベースでよく使われます。
  • ビットマップインデックス: 低基数のデータ(値の種類が少ないデータ)に効果的です。
  • ハッシュインデックス: 等価検索に対して高速ですが、範囲検索には適していません。

13. 分散トランザクション

13.1 分散トランザクションとは何か?

分散トランザクションは、複数のノード間で実行されるトランザクションです。データの一貫性を維持しながら分散システムでトランザクションを実行することが目的です。

13.2 二相コミット (2PC)

二相コミットは、分散トランザクションを実行するためのプロトコルで、次の2つのフェーズで構成されます。

  • 準備フェーズ: すべての参加者にトランザクションをコミットする準備ができているか尋ねます。
  • コミット/中止フェーズ: すべての参加者がコミットできる場合、トランザクションをコミットします。そうでない場合、トランザクションを中止します。

14. シャーディング

14.1 シャーディングとは何か?

シャーディングは、データベースを複数のインスタンスに分割するプロセスで、各インスタンスがデータセットの一部を管理します。これにより、データベースのスケーラビリティが向上します。

14.2 シャーディングの方法

  • ハッシュベースシャーディング: キーのハッシュ関数に基づいてデータをシャードに割り当てます。
  • 範囲ベースシャーディング: キーの範囲に基づいてデータをシャードに割り当てます。

15. データセンター

15.1 データセンターとは何か?

データセンターは、コンピュータシステム、通信システム、ストレージシステムなどの情報技術(IT)インフラストラクチャをホストする専用施設です。データセンターは、データの保存、処理、管理を行い、インターネットに接続します。

15.2 データセンターの特徴

  • 冗長性: システムの障害に対処するため、電源、冷却、通信リンクなどが冗長化されています。
  • セキュリティ: 物理的および論理的なセキュリティ対策が実施されています。
  • エネルギー効率: データセンターは、省エネルギー設計や冷却技術を利用して、消費電力を抑えます。

16. ロードバランシング

16.1 ロードバランシングとは何か?

ロードバランシングは、システムへの負荷を複数のサーバーに均等に分散させるプロセスです。これにより、システムの可用性、スケーラビリティ、およびパフォーマンスが向上します。

16.2 ロードバランシングの方法

  • ラウンドロビン: サーバーに順番にリクエストを割り当てます。
  • 最小接続: 現在最も少ない接続を持っているサーバーにリクエストを割り当てます。
  • IP ハッシュ: クライアントの IP アドレスに基づいてサーバーにリクエストを割り当てます。

以上が、分散システムの基本的なコンポーネントと概念です。これらのコンポーネントと概念を理解し、適切に適用することで、高可用性、スケーラビリティ、パフォーマンスのある分散システムを構築することができます。

Mình hy vọng bạn thích bài viết này và học thêm được điều gì đó mới.

Donate mình một ly cafe hoặc 1 cây bút bi để mình có thêm động lực cho ra nhiều bài viết hay và chất lượng hơn trong tương lai nhé. À mà nếu bạn có bất kỳ câu hỏi nào thì đừng ngại comment hoặc liên hệ mình qua: Zalo - 0374226770 hoặc Facebook. Mình xin cảm ơn.

Momo: NGUYỄN ANH TUẤN - 0374226770

TPBank: NGUYỄN ANH TUẤN - 0374226770 (hoặc 01681423001)

image.png


All rights reserved

Viblo
Hãy đăng ký một tài khoản Viblo để nhận được nhiều bài viết thú vị hơn.
Đăng kí