オラクル、MySQLからオブジェクトストアにある最大400テラバイトのCSVファイルなどにクエリを高速実行できる「MySQL HeatWave Lakehouse」発表

オラクルは米ラスベガスで10月17日から4日間に渡って開催したイベント「Oracle CloudWorld 2022」で、MySQL HeatWaveからオブジェクトストアのデータファイルに対して直接クエリを発行できる「MySQL HeatWave Lakehouse」を発表しました(日本オラクルの発表)。

MySQL HeatWaveはMySQLに搭載されているInnoDBに加えて分散インメモリデータベースエンジンを搭載。OLTP処理はInnoDBで実行し、OLAP処理は分散インメモリデータベースエンジンで実行することにより、MySQLそのままで統合的にOLTP、OLAP、機械学習処理などを高速に実行するマネージドサービスです。

今回発表された「MySQL HeatWave Lakehouse」は、このMySQL HeatWaveの新機能としてオブジェクトストア上のデータファイルに対するクエリを可能にしました。

これによりインメモリデータベースでは扱えないような、より大規模なデータに対する分析を可能にすると同時に、MySQLの通常のデータベース内のデータとオブジェクトストア上のデータの結合など、柔軟なデータ分析も実現されます。また、オブジェクトストアからETLを介してデータウェアハウスなどのデータベースへデータをロードするといった手間も不要になります。

fig

対応するデータ形式は、CSV、Parquet、AuroraおよびRedshiftのバックアップ形式など。

オラクルはMySQL HeatWave Lakehouseにおける400TBのデータを対象にしたTPC-Hベンチマークで、競合他社よりも高速な処理を実現していると説明しています。

fig

MySQL HeatWaveには、機械学習を活用して性能を最適化する「MySQL Autopilot」と呼ばれる機能がすでに提供されていますが、MySQL HeatWave LakehouseにはこのAutopilotの対応も発表されています。どのようにデータを配置し、どんなクエリを発行するのがよいか、などを適切なデータサンプリングを用いて教えてくれます。

fig

「MySQL HeatWave Lakehouse」はベータ公開されており、2023年前半に正式リリースとなる予定です。