<?xml version="1.0" encoding="UTF-8" ?>
<rss
    version="2.0"
    xmlns:atom="http://www.w3.org/2005/Atom"
    xmlns:content="http://purl.org/rss/1.0/modules/content/"
    xmlns:webfeeds="http://webfeeds.org/rss/1.0"
    xmlns:media="http://search.yahoo.com/mrss/"
    >
    <channel>
        <title>Pyspark Tag - Viblo</title>
        <link>https://viblo.asia/rss</link>
        <description><![CDATA[Free service for technical knowledge sharing]]></description>
        <atom:link href="https://viblo.asia/rss/tags/pyspark.rss" rel="self"></atom:link>
                <copyright>Sun* Inc.</copyright>
                                                <webfeeds:logo>https://viblo.asia/logo_full.svg</webfeeds:logo>
        <image>
            <url>https://viblo.asia/logo_full.svg</url>
            <title>Pyspark Tag - Viblo</title>
            <link>https://viblo.asia/rss</link>
        </image>
                                <language>vi-vn</language>
        <lastBuildDate>2026-05-15T14:30:19+07:00</lastBuildDate>
                <item>
            <title><![CDATA[TOP 30 câu hỏi phỏng vấn PySpark 2024]]></title>
                        <link>https://viblo.asia/p/top-30-cau-hoi-phong-van-pyspark-2024-aNj4vbvx46r</link>
            <guid isPermaLink="true">https://viblo.asia/p/top-30-cau-hoi-phong-van-pyspark-2024-aNj4vbvx46r</guid>
            <description><![CDATA[Vì công cụ và chuyên môn liên quan đến PySpark ngày càng được săn đón trên thị trường, bài viết này cung cấp bộ câu hỏi phỏng vấn và câu trả lời bao q...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Chuyện Data Engineer</dc:creator>
            <pubDate>2024-08-18 09:00:48</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Spark streaming với Kafka]]></title>
                        <link>https://viblo.asia/p/spark-streaming-voi-kafka-Ny0VG7n5VPA</link>
            <guid isPermaLink="true">https://viblo.asia/p/spark-streaming-voi-kafka-Ny0VG7n5VPA</guid>
            <description><![CDATA[Giới thiệu chung về Spark
Trước khi Spark ra đời, Hadoop là một tool mạnh mẽ và phổ biến, tuy nhiên Hadoop có những hạn chế nhất định và Spark ra đời ...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Minh Tuan</dc:creator>
            <pubDate>2024-05-09 01:02:53</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Xử lý dữ liệu phân tán sử dụng Apache Spark và SageMaker]]></title>
                        <link>https://viblo.asia/p/xu-ly-du-lieu-phan-tan-su-dung-apache-spark-va-sagemaker-x7Z4DnGPLnX</link>
            <guid isPermaLink="true">https://viblo.asia/p/xu-ly-du-lieu-phan-tan-su-dung-apache-spark-va-sagemaker-x7Z4DnGPLnX</guid>
            <description><![CDATA[Apache Spark là một công cụ phân tích hợp nhất để xử lý dữ liệu quy mô lớn. Spark framework thường được sử dụng trong luồng học máy để chuyển đổi dữ l...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Kiên Lý</dc:creator>
            <pubDate>2024-01-19 20:00:00</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Churn Customer Prediction]]></title>
                        <link>https://viblo.asia/p/churn-customer-prediction-E1XVOvP8LMz</link>
            <guid isPermaLink="true">https://viblo.asia/p/churn-customer-prediction-E1XVOvP8LMz</guid>
            <description><![CDATA[![](https://images.viblo.asia/1d198912-5370-4503-81ee-0b88d915868a.PNG)


High-level overview:
In unraveling this intricate problem, we delve into a d...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">nguyen trong nhan</dc:creator>
            <pubDate>2023-11-09 19:44:48</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[Giải thích và Ứng dụng của PySpark.sql.Window trong Xử lý Dữ liệu phân tán]]></title>
                        <link>https://viblo.asia/p/giai-thich-va-ung-dung-cua-pysparksqlwindow-trong-xu-ly-du-lieu-phan-tan-gwd43M73LX9</link>
            <guid isPermaLink="true">https://viblo.asia/p/giai-thich-va-ung-dung-cua-pysparksqlwindow-trong-xu-ly-du-lieu-phan-tan-gwd43M73LX9</guid>
            <description><![CDATA[Giới thiệu

Trong việc xử lý dữ liệu phân tán và tính toán song song, PySpark là một trong những công cụ phổ biến và mạnh mẽ nhất. Trong PySpark, pysp...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Kiên Lý</dc:creator>
            <pubDate>2023-05-30 09:19:55</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[PySpark Decorators: Tận dụng sức mạnh của Python Decorators trong việc phân tích dữ liệu lớn]]></title>
                        <link>https://viblo.asia/p/pyspark-decorators-tan-dung-suc-manh-cua-python-decorators-trong-viec-phan-tich-du-lieu-lon-bXP4WxPpJ7G</link>
            <guid isPermaLink="true">https://viblo.asia/p/pyspark-decorators-tan-dung-suc-manh-cua-python-decorators-trong-viec-phan-tich-du-lieu-lon-bXP4WxPpJ7G</guid>
            <description><![CDATA[PySpark là một trong những công cụ phổ biến nhất để xử lý và phân tích dữ liệu lớn. Nó cung cấp một API Python để làm việc với Apache Spark, một hệ th...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Kiên Lý</dc:creator>
            <pubDate>2023-05-24 15:38:28</pubDate>
                                                                                                        </item>
                <item>
            <title><![CDATA[PySpark với một project Machine Learning nho nhỏ]]></title>
                        <link>https://viblo.asia/p/pyspark-voi-mot-project-machine-learning-nho-nho-3RlL5GyB4bB</link>
            <guid isPermaLink="true">https://viblo.asia/p/pyspark-voi-mot-project-machine-learning-nho-nho-3RlL5GyB4bB</guid>
            <description><![CDATA[Trong không khi người người MayFest, nhà nhà MayFest, tiếp nối series tự học và khám phá về Data Sience, trong bài viết hôm nay mình sẽ chia sẻ cùng m...]]></description>
                        <dc:creator xmlns:dc="http://purl.org/dc/elements/1.1/">Trung Đức</dc:creator>
            <pubDate>2023-05-05 14:08:38</pubDate>
                                                                                                        </item>
            </channel>
</rss>
