Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

DataFrameの他言語との比較表が欲しい #1

Closed
chezou opened this issue Apr 19, 2015 · 8 comments
Closed

DataFrameの他言語との比較表が欲しい #1

chezou opened this issue Apr 19, 2015 · 8 comments
Labels

Comments

@chezou
Copy link
Contributor

chezou commented Apr 19, 2015

RとPython(Pandas)との比較表が欲しい

Interpreted Languages: JavaScript, PHP, Python, Ruby (Sheet One) - Hyperpolyglot みたいなイメージ

@chezou chezou added the dream label Apr 19, 2015
@sorami
Copy link
Member

sorami commented Apr 25, 2015

その昔 Comparing Julia and R’s Vocabularies というのをJohn Myles Whiteさんが書いてましたが、Python/Pandasじゃないし、大分古いですね...

公式ドキュメントには Noteworthy Differences from other Languages がありますが、網羅的なものが欲しいですね~。

@chezou
Copy link
Contributor Author

chezou commented Apr 25, 2015

なるほどー。
結構、Pythonだと.groupみたいに.でつなげていけば何かできそうな感じがするのですが、Juliaだとgrobalなところにmethodがいるから把握しづらいんですよね〜

@jiahao
Copy link

jiahao commented Apr 25, 2015

悪い日本語のことは、許してください。

スピード比較は、JuliaLang/julia#10428 を参照します。pandasとRのほうがDataframes.jlとBase.readdlm()よりです。pandasとRのread functionsがC言語に書きました。そして、garbage collectionや、type inferenceや色々のdynamic overheadがありません。Julia v0.4のgarbage collectorは改善を期待します。

@chezou
Copy link
Contributor Author

chezou commented Apr 26, 2015

@jiahao 良いissueを教えてくれてありがとうございます!

I think Julia's garbage collection is not so good, and I force gc before my benchmarking... :(

@chezou
Copy link
Contributor Author

chezou commented Apr 26, 2015

僕が欲しかったのはDataFramesMeta.jlでした。
これで、where, orderbyなどSQLlikeなDataFrameの処理が出来そうです

@chezou
Copy link
Contributor Author

chezou commented Apr 26, 2015

パフォーマンスについては、 index周りがないのが辛いという話をJuliaTokyo #3の懇親会で @bicycle1885 さんに聞きました

@chezou
Copy link
Contributor Author

chezou commented Apr 26, 2015

@jiahao
Copy link

jiahao commented Apr 26, 2015

@chezou ob/gctune branch を見て誘います。 @carnavalさんを討議しましたーJuliaLang/julia#10428 (comment)

今は、readdlmはgarbage collectorの最悪ケースです。Array{Any} outputのケースは、たくさんのboxed objectsが生産しました。Each time the gc runs, there is enough garbage removed so that the gc wants to continue being aggressive, even though there are O(N) objects at time N。それでは、実行時間はO(N^2)です。その branchに特殊なheuristicsがあります。

@chezou chezou closed this as not planned Won't fix, can't repro, duplicate, stale Aug 24, 2024
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants