注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。

10 - 新しいブランチで変更を加える

📖 タスクの概要

ワークブックの上部に Branch: test-branch が表示されるはずです。time_by_carrier 可視化ノードをクリックすると、画面の左下にコードが表示されます。現在の可視化は、飛行時間の合計が最も多い10社の航空会社ごとの飛行時間(分)のプロットを表示しています。次に、可視化を更新して、飛行時間が最も多い10のルートの異なる航空会社グループごとの飛行時間(分)のプロットを表示するようにします。

🔨 タスクの説明

def time_by_carrier(us_freight_flights): 
    tf_pdf = us_freight_flights.withColumn('route', F.concat(F.col("origin"), F.lit("-"), F.col("dest"))).toPandas() 
    tf_grouped = tf_pdf.groupby('route')['actual_elapsed_time'].sum().to_frame().reset_index() 
    # 上位10社のキャリアに絞り込み
    tf_grouped = tf_grouped.sort_values(by=['actual_elapsed_time'], ascending=False).head(10) 
    # 棒グラフを描画
    tf_grouped.plot.bar(x='route', y='actual_elapsed_time') 
    plt.tight_layout() 
    plt.xticks(rotation=70) 
    plt.show() 
    # 元のデータフレームを返す
    return us_freight_flights
  1. 上記のブロックで time_by_carrier のコード全体を置き換えます。
  2. 更新された変換を実行するには、プレビューをクリックします。
  3. 変換が実行されたら、コードエディタの下にあるビジュアライゼーションタブをクリックして、更新されたプロットを表示します。