lấy dữ liệu sử dụng pandas
Có anh chị nào đã từng xử lý lỗi này ko ạ. E sử dụng pandas để lấy dữ liệu mà bị lỗi Nan. A chị xem code chỉ giúp e với ạ
mport pandas as pd
import matplotlib.pyplot as plt
a = pd.read_excel('bkct.xlsm',header=9,encoding='utf-8')
print(a.info())print(a[['ĐT Nợ','YT Nợ','Tiền hàng VAT']].dropna())
print(a.info())
Yếu tố 2 10845 non-null object
Tiền hàng VAT 982 non-null float64
E sử dụng dropna đẻ loại bỏ các dòng " Nan "mà ko được ạ Mong các cao nhân chỉ giúp e với ạ
1 CÂU TRẢ LỜI
Khi bạn sử dụng dropna()
, pandas
sẽ trả lại cho bạn một cái bảng mới không có NaN
và không sửa thẳng vào bảng cũ. Vậy nên, khi bạn print
lại, bảng cũ sẽ vẫn có NaN
.
Để tránh việc này, bạn có thể viết đè lên bảng cũ:
a = a.dropna()
hoặc sử dụng lựa chọn có sẵn của pandas
:
a.dropna(inplace=True)
lưu ý: trong code của bạn hiện tại đang thiếu một dấu xuống dòng trước dòng print
. đồng thời, bạn có 3 dòng print
mà output ngắn quá, bạn có đang copy thiếu gì không?
cám ơn bạn nhưng vẫn ko được ạ kết quả trả về là Empty DataFrame Columns: [ĐT Nợ, YT Nợ, Tiền hàng VAT] Index: [] Mình ko cop thiếu gì đâu bạn. Ouput minh cop chi để moij người biết infor ma mình muốn xuất ra thui nên mình ko cop hết ouput
@MAINT nếu vậy có thể là data của bạn hàng nào cũng có N/A? bạn có thể kiểm tra 5 dòng đầu với a.head()
xem data ra sao.
ok thanks b nhé. mà mình hỏi chút sao mình dùng pandas để pivot mà số liệu sum toàn bị lệch.ko biêt pandas có tin tưởng được ko nhỉ hoang mang quá
@MAINT mình khá chắc là pandas
không có lỗi gì dâu vì ai làm data science cũng dùng nó :-j bạn thử tạo ra một bảng chơi để test xem sao?