注: 以下の翻訳の正確性は検証されていません。AIPを利用して英語版の原文から機械的に翻訳されたものです。
ワークブックの上部に Branch: test-branch が表示されるはずです。time_by_carrier
可視化ノードをクリックすると、画面の左下にコードが表示されます。現在の可視化は、飛行時間の合計が最も多い10社の航空会社ごとの飛行時間(分)のプロットを表示しています。次に、可視化を更新して、飛行時間が最も多い10のルートの異なる航空会社グループごとの飛行時間(分)のプロットを表示するようにします。
def time_by_carrier(us_freight_flights):
tf_pdf = us_freight_flights.withColumn('route', F.concat(F.col("origin"), F.lit("-"), F.col("dest"))).toPandas()
tf_grouped = tf_pdf.groupby('route')['actual_elapsed_time'].sum().to_frame().reset_index()
# 上位10社のキャリアに絞り込み
tf_grouped = tf_grouped.sort_values(by=['actual_elapsed_time'], ascending=False).head(10)
# 棒グラフを描画
tf_grouped.plot.bar(x='route', y='actual_elapsed_time')
plt.tight_layout()
plt.xticks(rotation=70)
plt.show()
# 元のデータフレームを返す
return us_freight_flights
time_by_carrier
のコード全体を置き換えます。