کتابخانه Pandas یکی از کتابخانه‌های محبوب پایتون است که برای تحلیل و مدیریت داده‌های ساختاریافته طراحی شده است. با استفاده از Pandas، می‌توانید داده‌ها را بخوانید، پردازش کنید و تجزیه و تحلیل کنید.

نصب Pandas

نصب Pandas مانند دیگر کتابخانه‌ها ساده است. می‌توانید از pip استفاده کنید:

pip install pandas

داکیومنت کتابخانه Pandas

داده‌ها در Pandas

Pandas به طور خاص به دو نوع ساختار داده‌ای اصلی می‌پردازد: Series و DataFrame.

Series

Series یک آرایه یک‌بعدی است که می‌تواند هر نوع داده‌ای را نگه‌داری کند. به عنوان مثال:

import pandas as pd

s = pd.Series([1, 2, 3, 4])
print(s)

DataFrame

DataFrame، ساختاری دو بعدی است که به جدول‌ها شباهت دارد. هر ستون می‌تواند نوع داده‌ای متفاوت داشته باشد:

data = {'نام': ['علی', 'زینب', 'رضا'],
'سن': [25, 30, 28]}
df = pd.DataFrame(data)
print(df)

خواندن و نوشتن داده‌ها

یکی از قابلیت‌های مهم Pandas، خواندن و نوشتن داده‌ها از و به فرمت‌های مختلف (CSV، Excel و …) است.

خواندن داده از فایل CSV

df = pd.read_csv('data.csv')
print(df)

نوشتن داده‌ها به فایل CSV

df.to_csv('output.csv', index=False)

آموزش پایتون از صفر (رایگان)

تجزیه و تحلیل داده‌ها

Pandas امکانات قدرتمندی برای پردازش و تجزیه و تحلیل داده‌ها ارائه می‌دهد. می‌توانید داده‌ها را فیلتر کنید، گروه‌بندی کنید و استاتیک‌های مختلف را محاسبه کنید.

فیلتر کردن داده‌ها

filtered_df = df[df['سن'] > 25]
print(filtered_df)

گروه‌بندی داده‌ها

grouped = df.groupby('نام').mean()
print(grouped)

نتیجه‌گیری

Pandas با ارائه‌ی ابزارهای کامل برای تجزیه و تحلیل داده‌ها به یکی از مهم‌ترین کتابخانه‌ها در علم داده تبدیل شده است. این کتابخانه به شما کمک می‌کند تا به راحتی داده‌های خود را مدیریت و تحلیل کنید. در دنیای امروز که داده‌ها به سرعت در حال افزایش هستند، یادگیری Pandas برای هر کسی که با داده کار می‌کند، ضروری است.