آنچه در این مقاله میخوانید [پنهانسازی]
کتابخانه Pandas یکی از کتابخانههای محبوب پایتون است که برای تحلیل و مدیریت دادههای ساختاریافته طراحی شده است. با استفاده از Pandas، میتوانید دادهها را بخوانید، پردازش کنید و تجزیه و تحلیل کنید.
سرفصل های مقاله
نصب Pandas
نصب Pandas مانند دیگر کتابخانهها ساده است. میتوانید از pip استفاده کنید:
pip install pandas
دادهها در Pandas
Pandas به طور خاص به دو نوع ساختار دادهای اصلی میپردازد: Series و DataFrame.
Series
Series یک آرایه یکبعدی است که میتواند هر نوع دادهای را نگهداری کند. به عنوان مثال:
import pandas as pd
s = pd.Series([1, 2, 3, 4])
print(s)
DataFrame
DataFrame، ساختاری دو بعدی است که به جدولها شباهت دارد. هر ستون میتواند نوع دادهای متفاوت داشته باشد:
data = {'نام': ['علی', 'زینب', 'رضا'],
'سن': [25, 30, 28]}
df = pd.DataFrame(data)print(df)
خواندن و نوشتن دادهها
یکی از قابلیتهای مهم Pandas، خواندن و نوشتن دادهها از و به فرمتهای مختلف (CSV، Excel و …) است.
خواندن داده از فایل CSV
df = pd.read_csv('data.csv')
print(df)
نوشتن دادهها به فایل CSV
df.to_csv('output.csv', index=False)
تجزیه و تحلیل دادهها
Pandas امکانات قدرتمندی برای پردازش و تجزیه و تحلیل دادهها ارائه میدهد. میتوانید دادهها را فیلتر کنید، گروهبندی کنید و استاتیکهای مختلف را محاسبه کنید.
فیلتر کردن دادهها
filtered_df = df[df['سن'] > 25]
print(filtered_df)
گروهبندی دادهها
grouped = df.groupby('نام').mean()
print(grouped)
نتیجهگیری
Pandas با ارائهی ابزارهای کامل برای تجزیه و تحلیل دادهها به یکی از مهمترین کتابخانهها در علم داده تبدیل شده است. این کتابخانه به شما کمک میکند تا به راحتی دادههای خود را مدیریت و تحلیل کنید. در دنیای امروز که دادهها به سرعت در حال افزایش هستند، یادگیری Pandas برای هر کسی که با داده کار میکند، ضروری است.