ByteRef
← Home
🐼

Pandas análise de dados Python

pythondataanalysis
📊 Criação & Leitura
Importar pandasimport pandas as pd
Criar DataFramedf = pd.DataFrame({'A': [1, 2, 3], 'B': [4, 5, 6]})
Criar Seriess = pd.Series([1, 2, 3, 4, 5])
Ler CSVdf = pd.read_csv('file.csv')
Ler Exceldf = pd.read_excel('file.xlsx', sheet_name='Sheet1')
Ler JSONdf = pd.read_json('file.json')
Ler SQLdf = pd.read_sql('SELECT * FROM table', conn)
Ler parquetdf = pd.read_parquet('file.parquet')
🔍 Exploração de Dados
Ver primeiras linhasdf.head()
Ver últimas linhasdf.tail()
Info do DataFramedf.info()
Estatísticas descritivasdf.describe()
Shape (linhas, colunas)df.shape
Nomes das colunasdf.columns
Índicedf.index
Valores únicosdf['column'].unique()
Contar valores únicosdf['column'].value_counts()
✂️ Seleção & Filtros
Selecionar colunadf['column']
Selecionar múltiplas colunasdf[['col1', 'col2']]
Selecionar por posiçãodf.iloc[0:5, 1:3]
Selecionar por labeldf.loc[0:5, 'col1':'col3']
Filtrar por condiçãodf[df['age'] > 30]
Múltiplas condiçõesdf[(df['age'] > 30) & (df['city'] == 'SP')]
Filtrar valores nulosdf.dropna()
Preencher valores nulosdf.fillna(0)
🔧 Manipulação de Dados
Adicionar colunadf['new_col'] = df['col1'] + df['col2']
Renomear colunasdf.rename(columns={'old': 'new'})
Remover colunadf.drop('column', axis=1)
Ordenar valoresdf.sort_values('column')
Agrupar e agregardf.groupby('category')['value'].sum()
Pivot tablepd.pivot_table(df, values='value', index='row', columns='col')
Merge/Joinpd.merge(df1, df2, on='key', how='left')
Concatenarpd.concat([df1, df2], axis=0)
📈 Análise & Estatísticas
Média por grupodf.groupby('group')['value'].mean()
Correlaçãodf.corr()
Rolling statisticsdf['value'].rolling(window=7).mean()
Percentisdf['value'].quantile([0.25, 0.5, 0.75])
Value counts normalizadodf['category'].value_counts(normalize=True)
Crosstabpd.crosstab(df['col1'], df['col2'])
Apply functiondf['new_col'] = df['col'].apply(lambda x: x**2)
💾 Export & I/O
Salvar CSVdf.to_csv('file.csv', index=False)
Salvar Exceldf.to_excel('file.xlsx', sheet_name='Sheet1')
Salvar JSONdf.to_json('file.json', orient='records')
Salvar Parquetdf.to_parquet('file.parquet')
Salvar SQLdf.to_sql('table_name', conn, if_exists='replace')
Pickle (serialização)df.to_pickle('file.pkl')
Ler Pickledf = pd.read_pickle('file.pkl')
BR ByteRef DevOps & Backend Reference · 2026 — comandos