私は解決策を得るために2つの可能な方法があるかもしれません。リモートVPSデータベースにデータを書き込む
私はサードパーティアプリケーションを使用して毎日データをpandasデータフレームにダウンロードし、それをローカルのpostgresデータベースに書き込みます。データフレームは大きいですが、データベースがローカルなので、私は単にdf.to_sql
を使用して、ほんの数秒で完了します。
問題は、リモートのLinuxサーバー(VPS)にデータベースを移動したことです。 to_sql
も同じように1時間以上かかります。私はchunksize
の様々な値を試しましたが、それはあまり役に立ちません。
サードパーティ製のアプリケーションをリモートサーバーにインストールするだけでも問題はありませんが、サーバーOSはGUIを使用しません。 GUIを必要とするにもかかわらず、サードパーティのアプリケーションをサーバー上で実行する方法はありますか? (注意:それはWindowsアプリケーションなので、ローカルのLinuxマシンでワインを実行するためにワインを使用し、おそらくサーバー上でワインを実行する必要があります)。
VPSでGUIが必要なアプリケーションを実行する方法がない場合、ローカルマシンからこれらのデータフレームをVPSに書き込むにはどうすればよいですか?私は、小さな部分にデータフレームを書き込む方法や、これにもっと適したものを使う方法があると願っています(to_sql
)。
データフレームをcsvファイルに書き込み、ftpを使用してサーバーにアップロードし、サーバーに別のpythonスクリプトを実行してデータをdbに保存します。私はそれが動作すると思うが、それは確かに理想的ではない。