Python和R都有data frame的package,比如pandas,dplyr,polars, data.table等等。这些package无非就是实现了SQL的功能。他们有各自的语法。你要学习这些,就必须掌握它们的语法。问题是这些东西还处在发展期,语法是在变的。而且,会了Pandas的语法,如果要用R,就需要重新学习另外一个package的语法。
这些都毫无必要。你可以用DuckDB + SQL 做同样的事情。DuckDB支持Python, R, Julia,C++等等语言,所以不管你用什么语言,都可以用DuckDB。这样你在转换语言的时候,根本不用重新学习一个data frame的package。由于是SQL语句,可读性非常好。
DuckDB的性能也比Pandas和dplyr之类强多了。