実績紹介
VA Linuxで対応させていだいた実績をご紹介します。
VA Linuxには、2000年の設立からLinuxカーネル集団として
培ってきた開発実績があります。
幅広い分野のOSSをソースコードからサポートできる技術者が
多数在籍しており、各々の経験と実
績を結集させ、問題解決に
真摯に日々向き合っています。
基盤系を中心としたOSSにおいて、技術領域を年々拡大しており、
企業様から様々なご依頼を頂いております。VA Linuxで対応させて頂いた実績をご紹介します。
-
コンサルティングサービス技術調査
- Persistent Memory
- Disaggregated Computing
libfabricの利用方法に関する技術調査
依頼内容リモートパーシステントメモリ (RPM) 関連技術動向をまとめるレポートの作成調査内容2018年4月に米国コロラド州ボルダーで開催されたOpenFabrics Alliance Workshop 2018(第14回)を振り返る技術レポートを作成した。日本からの参加は、弊社含めて2名。
OpenFabrics Alliance(OFA)は主にInfiniBand機器ベンダ各社を中心とする組織で、RDMAプログラミングに必要なソフトウェアスタックをOSS開発している。
HPEがThe Machineプロジェクトでディスアグリゲーテッドコンピューティングのコンセプトを打ち出して話題を呼んでいたこの時期に開催されたOFA Workshop 2018では、RPMのユースケースを募集するワーキンググループ的なセッションや、RPMの実現に必要なInfiniBand/RoCE/iWARP仕様拡張に関する議論が行われていた。
当社は、パーシステントメモリ(PM)のリモート拡張に将来ビジネス(OSS開発案件)の大きな可能性を感じている。技術調査コミュニティ活動- TensorFlow
- AR
深層学習技術に関するOSSの技術調査
依頼内容・ 深層学習に関するOSSについての技術調査、評価、コミュニティ対応
・ 深層学習に関するOSSを組み合わせたプロトタイプシステムの技術検討調査内容・ 深層学習のOSSであるTensorFlowの技術調査
・ TensorFlow と ARCore を組みあわせた評価プログラムを作成し実機での評価を実施
・ OSSを組み合わせた評価と検証を行い、報告書を作成技術調査コミュニティ活動- Linux Kernel
- OpenStack
- DPDK
OpenStack ネットワーク機能に関する技術情報調査とコミュニティ対応
依頼内容Open Stack NFV関連機能および品質向上に向けた技術調査と機能の改善調査内容・ ソースコード調査および機能改善のためのパッチ作成
・ OpenStackコミュニティへの提案と議論を実施し、コミュニティからのフィードバックを反映 -
開発支援サービス開発支援保守
- OS
組み込みOSのフルスクラッチ開発
依頼内容AUTOSAR仕様のOSのフルスクラッチ開発および実装開発内容・ スケーラビリティクラス1~4対応、マルチコア対応でのOS開発
・ 車載業界でメージャーな各種CPUに対応 (AURIX, RH850, PowerPC, ARM他)
・ 各種コンパイラに対応 (GHS、HighTec、gcc他)
・ チューニング
・ 実ターゲットを用いたテストプログラム自動実行環境と、クラウドを利用した大規模なテスト自動実行環境の構築R&D 支援- Linux Kernel
- FPGA
- vRAN
アクセラレータに関する技術調査
依頼内容FPGA等を活用したアクセラレータの効率化・低消費電力化を目指した技術調査開発内容DC等のアクセラレータを共用化を目指し、リソーススケジューリング機能の調査および実装を行った。R&D 支援- Linux Kernel
- FPGA
- vRAN
アクセラレータの高効率利用技術の調査と実装
依頼内容アクセラレータを高効率に利用するための技術調査開発内容・ アクセラレータを高効率・柔軟に利用するためのミドルウェアの実装
・ 各種高速化方法(データのゼロコピー化等)の検討と実装R&D 支援- Linux Kernel
- DPDK
無線ネットワーク品質制御システムの技術研究支援
依頼内容・ 店舗等で提供するWi-Fi等に対する無線品質制御システムの研究支援
・ PoCの作成評価
・ 集中制御コントローラによる無線ネットワーク品質制御技術の制御信号無線化を実現する方式の調査開発内容・ 無線区間衝突回避の為の提案アルゴリズムの、Linux Kernel 上での設計〜開発支援
・ 無線区間品質向上の為の、集中制御コントローラの設計〜開発支援
・ 予測トラヒック制御の為の、データプレーン制御部分の設計〜開発支援 -
障害解析サポートサービス障害解析
- Kernel
クラウドサービス上で稼働中のお客様環境でカーネルパニックが発生
障害内容・ お客様の基幹システムで稼働するサーバがカーネルパニックでOSが起動せず、基幹システムが停止。
・ 1日前のバックアップに戻すことでのデータリカバリを伴う状況となり、多大な影響が発生。
・ サポート切れの RHEL のため、保守ベンダの調査が進まない状況。対応内容・ お客様側で実施したアップグレード時の問題であることを特定。
・ 回避策を提示し、お客様からは多大なる感謝をいただいた。障害解析- Kubernetes
Kubernetes Applicationのデプロイ時にOSプロセスがハングする障害が発生
障害内容・ アプリケーションのデプロイ中に複数プロセスがスタックし、リブートするまで復旧しない。
・ ログを確認すると、複数のプロセスがスタックしており、どこに問題があるのか原因究明してほしい。解析内容・ カーネルのネットワークスタックと、あるNICドライバ内部との間でデッドロックが発生している模様。
・ ドライバソースコード調査の結果、ドライバの不具合が原因と判明。解析結果- ・ドライバの不具合についてベンダー側に報告した結果、最新のドライバでは修正されていることがわかった。
- ・ドライバーの更新で障害が解決した。
障害の切り分けを行い、原因を究明した結果、不具合元の修正がベンダーにより実施された。障害解析- Open vSwitch
- DPDK
Open vSwitch (OvS)/DPDK環境でコントローラコマンドによりパケット転送が延する
障害内容OvS/DPDK 環境において、OpenFlowコントローラのコマンドを実行すると、パケット転送が数秒遅延する。原因と対策を調査してほしい。解析内容障害切分け、原因調査
- 再現環境用意・試験の実施、OvS/DPDKの各スレッドの動作を調査するためのソースコード解析、関連ドライバの調査、パケットダンプ調査解析結果- ・pingが送信できていない。CPU資源がバッティングしている可能性。
- ・OpenFlowコントローラとの通信とパケット送信処理を同一のスレッドで実行している。
OvSの仕様が原因であることを特定。障害解析- Docker
コンテナから見たストレージの性能が低い
障害内容コンテナから見たストレージの性能が異常に低い。
ベアメタルで動かしていたアプリケーションを Docker コンテナ化して運用しようとしているが、性能が出ない。どうやらストレージの性能が出せていないようだ。解析内容調査手法: コンテナホストでの sar 調査解析結果コンテナホストで動作していた sar (sysstat) を調査したところ、高負荷時にストレージの性能が限界に達していた。コンテナのファイルシステムにアプリケーションのデータを保存しようとしていたのが原因。ボリュームを利用するようにすることで性能もベアメタルと同等に改善したかつて、コンテナのファイルシステムは、差分ファイルシステムの実現のために aufs (Another Union Filesystem) を利用しており、性能や安定性に問題がありました。
現在では、device mapper を使ったものなどが主流ですが、コンテナ内のファイルシステムは永続的ではないため、アプリケーションデータはボリュームに保存することが推奨されています。障害解析- Docker
Docker Engine が起動しない
障害内容Docker Engine のアップグレードを行ったところ、既存のコンテナが動かなくなってしまった。
または、エラーが出てエンジンが起動しなくなってしまった。
CentOS Extras リポジトリから Docker Engine をインストールして利用している。セキュリティのため、まず検証環境にて Docker パッケージを yum update で更新したところ、docker ps などあらゆる docker コマンドが「Cannot connect to the Docker daemon.」というエラーを吐くようになってしまった。解析内容本番環境への適用のため、ログ解析による原因の調査および解決策の提示解析結果syslog によると、「permission denied」により Docker デーモンの起動に失敗していると判明した。
一般に、SELinux のポリシー違反が permission denied となるため、SELinux のログ audit.log を調査した結果、SELinux ポリシー違反が原因であることが分かった。Docker Engine のメジャーアップデートにより動作が変わり、SELinux ポリシー定義が不足しているという、パッケージの不具合であると思われた。SELinux 追加ポリシーの定義を行った。ディストリビュータへのレポートを検討していたが、Docker Engine は、急速に普及したこと、開発スピードが速いことなどから、ディストリビュータによる通常サポートからはずれた別パッケージとして提供されることがあります。
まもなく更新パッケージの配布が始まった。
CentOS においても、Extrasリポジトリからの提供となり、OS のアップグレード以外のタイミングで Docker Engine のメジャーバージョンが上がってしまうことがあります。
これにより、前バージョンからの非互換な変更や、設定の非推奨化などが行われることがあるため、本番環境に適用する前の調査や検証がより重要になると思われます。
- 各種ご質問、ご要望に関しましては、下記よりご連絡ください。
お客様のご要望に合わせた最適なサポートサービスを提供するため、個別に契約内容を相談させていただきます。