云創(chuàng)大數(shù)據(jù)的實習(xí)崗位不僅針對在校的以及畢業(yè)的大學(xué)生,高中生也是可以的!
最近有兩名學(xué)員順利完成了云創(chuàng)大數(shù)據(jù)的實習(xí)課程,并各自寫了一份實習(xí)報告心得,里面比較詳實的記錄了他們的學(xué)習(xí)內(nèi)容以及切身感受,我們一起來看看吧~
— 實習(xí)報告全文 —
01
2025級應(yīng)屆錄取生
浙江工業(yè)大學(xué) 軟件工程專業(yè)
學(xué)生 / 卞煒正
一、引言
在信息技術(shù)飛速發(fā)展的今天,大數(shù)據(jù)與人工智能技術(shù)已成為推動各行業(yè)創(chuàng)新與發(fā)展的核心驅(qū)動力。我有幸獲得了在云創(chuàng)大數(shù)據(jù)實習(xí)的機會,這是一家在大數(shù)據(jù)存儲與智能處理領(lǐng)域極具影響力的企業(yè),以數(shù)據(jù)和 AI 算法為引擎,驅(qū)動政府、教育、智能制造等領(lǐng)域的數(shù)字化、智能化轉(zhuǎn)型升級。此次實習(xí),為我打開了通往大數(shù)據(jù)與人工智能世界的實踐之門。
二、崗位介紹
我在實習(xí)期間擔(dān)任數(shù)字人項目開發(fā)實習(xí)生的組員身份,主要負責(zé)運用通義千問、Qwen 等大語言模型生成文案內(nèi)容,通過文字轉(zhuǎn)語音程序?qū)⑽陌皋D(zhuǎn)化為音頻,利用 Heygem 數(shù)字人生成系統(tǒng)完成視頻的制作,實現(xiàn)從文本到數(shù)字人視頻的全流程創(chuàng)作。同時,深入學(xué)習(xí)數(shù)據(jù)庫的使用,通過 Python 進行數(shù)據(jù)處理與分析的實戰(zhàn)操作,運用 Python 爬蟲技術(shù)獲取相關(guān)數(shù)據(jù),維護爬蟲程序的穩(wěn)定運行,調(diào)用 LLM 的 api ,實現(xiàn)模型與其他系統(tǒng)的交互,并對項目中的各個端口進行統(tǒng)籌規(guī)劃,確保數(shù)據(jù)的流暢傳輸與系統(tǒng)的高效運行。
三、實習(xí)內(nèi)容與成果
(一)融入數(shù)字人生成項目
數(shù)字人生成項目旨在利用先進的人工智能技術(shù),打造高度逼真、個性化的數(shù)字人形象,應(yīng)用于商業(yè)推廣。在這個過程中,我逐漸熟悉了項目的整體架構(gòu)和業(yè)務(wù)流程,明確了自己在項目中的職責(zé),也感受到了團隊成員之間緊密協(xié)作、積極進取的工作氛圍,這使我迅速融入其中,為后續(xù)工作的開展奠定了良好基礎(chǔ)。
(二)大模型與文案生成
Qwen 大模型在數(shù)字人生成項目中扮演著至關(guān)重要的角色,它們負責(zé)根據(jù)給定的主題和要求生成高質(zhì)量的文案內(nèi)容。在利用模型生成文案時,我遇到了一些挑戰(zhàn),如生成的文案有時會出現(xiàn)邏輯不連貫、內(nèi)容空洞等問題。為了解決這些問題,我深入研究了模型的參數(shù)設(shè)置和提示工程技巧,通過調(diào)整提示詞的結(jié)構(gòu)、增加上下文信息、設(shè)置明確的指令等方式,引導(dǎo)模型生成更符合需求的文案。
(三)文字轉(zhuǎn)語音與數(shù)字人視頻生成
文字轉(zhuǎn)語音程序和 Heygem 數(shù)字人生成系統(tǒng)是實現(xiàn)數(shù)字人從文本到視頻轉(zhuǎn)化的關(guān)鍵工具。在使用 Heygem 數(shù)字人生成系統(tǒng)生成視頻時,也遇到了一些技術(shù)難題,如數(shù)字人的面部表情和肢體動作不夠自然、視頻合成過程中出現(xiàn)卡頓等。我通過深入學(xué)習(xí) Heygem 的技術(shù)文檔和操作指南,掌握了數(shù)字人模型的參數(shù)調(diào)整方法,對數(shù)字人的面部表情和肢體動作進行精細調(diào)整,使其更加符合文案的情感表達和語境。針對視頻合成卡頓的問題,我檢查了系統(tǒng)的硬件配置和軟件設(shè)置,優(yōu)化了視頻渲染參數(shù),采用了分批次渲染和多線程處理等技術(shù),提高了視頻合成的效率和穩(wěn)定性。
(四)數(shù)據(jù)庫、Python 與爬蟲的學(xué)習(xí)運用
數(shù)據(jù)庫在數(shù)字人生成項目中用于存儲和管理大量的文本、音頻、視頻等數(shù)據(jù),確保數(shù)據(jù)的安全、高效訪問。我在實習(xí)期間學(xué)習(xí)了 MySQL 數(shù)據(jù)庫的基本操作,包括數(shù)據(jù)庫的創(chuàng)建、表的設(shè)計、數(shù)據(jù)的插入、查詢、更新和刪除等。通過實際項目中的應(yīng)用,我深刻理解了數(shù)據(jù)庫設(shè)計的重要性,學(xué)會了如何根據(jù)項目需求設(shè)計合理的數(shù)據(jù)庫結(jié)構(gòu),優(yōu)化數(shù)據(jù)庫查詢語句,提高數(shù)據(jù)的讀寫性能。
Python 作為一種廣泛應(yīng)用于數(shù)據(jù)處理和人工智能領(lǐng)域的編程語言,在項目中發(fā)揮著重要作用。我在實習(xí)前雖然對 Python 有一定的了解,但在實際項目中,面對復(fù)雜的業(yè)務(wù)邏輯和技術(shù)難題,我發(fā)現(xiàn)自己的知識儲備還遠遠不夠。于是,我利用業(yè)余時間系統(tǒng)學(xué)習(xí)了 Python 的高級特性,通過技術(shù)博客和開源項目等渠道,不斷積累 Python 編程經(jīng)驗。在項目中,我運用 Python 進行數(shù)據(jù)處理和分析,編寫腳本實現(xiàn)數(shù)據(jù)的自動化處理和任務(wù)調(diào)度,提高了工作效率。
爬蟲技術(shù)則用于從互聯(lián)網(wǎng)上獲取與數(shù)字人相關(guān)的文本、圖片和視頻等數(shù)據(jù),為數(shù)字人項目提供豐富的素材。我學(xué)習(xí)了 Python 爬蟲的基本原理和常用框架,并結(jié)合實際項目需求,編寫爬蟲程序獲取特定網(wǎng)站的數(shù)據(jù)。
四、實習(xí)收獲與體會
(一)專業(yè)技能提升
在云創(chuàng)大數(shù)據(jù)實習(xí)的這段時間,我的專業(yè)技能得到了全方位的提升。在大語言模型的應(yīng)用方面,我從最初的理論學(xué)習(xí)逐漸深入到實際操作,通過不斷調(diào)整模型參數(shù)和優(yōu)化提示詞,能夠更加熟練地運用Qwen 大模型生成高質(zhì)量、符合業(yè)務(wù)需求的文案 。這不僅加深了我對大語言模型原理的理解,還讓我掌握了如何根據(jù)不同的應(yīng)用場景靈活運用模型的技巧,例如在為不同風(fēng)格的數(shù)字人視頻撰寫文案時,能夠精準地引導(dǎo)模型輸出相應(yīng)風(fēng)格的內(nèi)容。
數(shù)據(jù)庫的學(xué)習(xí)與應(yīng)用也讓我對數(shù)據(jù)的存儲和管理有了更深入的理解。通過學(xué)習(xí) MySQL 數(shù)據(jù)庫的操作,我能夠根據(jù)項目需求設(shè)計合理的數(shù)據(jù)庫表結(jié)構(gòu),編寫高效的 SQL 查詢語句,實現(xiàn)數(shù)據(jù)的快速存儲、查詢和更新。在數(shù)字人項目中,數(shù)據(jù)庫用于存儲大量的文本、音頻和視頻數(shù)據(jù),我通過優(yōu)化數(shù)據(jù)庫查詢語句和索引設(shè)計,確保了數(shù)字人系統(tǒng)的穩(wěn)定運行。
(二)團隊協(xié)作感悟
團隊協(xié)作是我在實習(xí)期間的另一大重要收獲。在數(shù)字人生成項目中,團隊成員來自不同的專業(yè)領(lǐng)域,包括算法、開發(fā)、設(shè)計等,每個人都在項目中扮演著不可或缺的角色。通過與他們的緊密合作,我深刻體會到了團隊協(xié)作的力量。經(jīng)過大家的共同討論和協(xié)作,最終找到了解決問題的最佳途徑 ,提高了數(shù)字人視頻的質(zhì)量和用戶體驗。
團隊合作精神的培養(yǎng)也是一個重要的方面。在項目遇到困難時,團隊成員之間相互支持、相互鼓勵,共同尋找解決問題的方法。在項目的攻堅階段,由于時間緊迫,任務(wù)繁重,大家都面臨著巨大的壓力。但是,團隊成員沒有退縮,而是相互協(xié)作,共同攻克了一個又一個技術(shù)難題,確保了項目的按時完成。這種團隊合作精神不僅讓我在工作中感受到了溫暖和力量,也讓我明白了在一個團隊中,只有大家心往一處想,勁往一處使,才能實現(xiàn)共同的目標。
五、總結(jié)與展望
回顧實習(xí)經(jīng)歷,我深感充實滿足。在實踐中深化了對專業(yè)知識的理解,掌握了許多實用的技術(shù)和方法,實現(xiàn)了從理論到實踐的跨越。
實習(xí)過程中必不可少的是正式員工們悉心的指導(dǎo)和幫助。是你們的耐心教導(dǎo)和無私分享,讓我能夠迅速融入團隊,順利完成各項工作任務(wù)。
展望未來,大數(shù)據(jù)和人工智能領(lǐng)域?qū)⒂瓉砀訌V闊的發(fā)展空間,我希望能夠繼續(xù)在這個充滿挑戰(zhàn)和機遇的領(lǐng)域深入學(xué)習(xí)和探索,不斷提升自己的專業(yè)素養(yǎng)和綜合能力。未來,我計劃進一步深入學(xué)習(xí)大語言模型的原理和應(yīng)用,探索其在更多領(lǐng)域的創(chuàng)新應(yīng)用;加強對人工智能算法和機器學(xué)習(xí)技術(shù)的研究,提升自己在模型訓(xùn)練和優(yōu)化方面的能力;同時,關(guān)注行業(yè)的最新動態(tài)和發(fā)展趨勢,不斷拓寬自己的技術(shù)視野,為推動技術(shù)的發(fā)展貢獻自己的一份力量。
02
南京理工大學(xué)紫金學(xué)院
軟件工程專業(yè)(專業(yè)排名前十)
大三學(xué)生 / 李鑫
一、實習(xí)崗位介紹
我深知實習(xí)對職業(yè)發(fā)展的重要性,有幸于2025年4月7日至8月14日在南京云創(chuàng)大數(shù)據(jù)科技股份有限公司進行了為期超四個月的Java后端開發(fā)實習(xí)。作為后端 Java 開發(fā)崗實習(xí)生,主要負責(zé)協(xié)助團隊進行后端服務(wù)的開發(fā)與維護。
具體工作包括:參與需求分析與技術(shù)方案設(shè)計,基于Spring Boot/Cloud框架開發(fā)RESTful接口;設(shè)計與優(yōu)化數(shù)據(jù)庫表結(jié)構(gòu),編寫高效 SQL 語句;進行接口單元測試與集成測試;協(xié)助解決線上服務(wù)出現(xiàn)的技術(shù)問題;參與技術(shù)文檔編寫等。該崗位要求扎實的 Java 基礎(chǔ),熟悉常用開發(fā)框架及數(shù)據(jù)庫技術(shù),注重邏輯思維與問題解決能力。
二、實習(xí)內(nèi)容及過程
實習(xí)初期,我在前輩指導(dǎo)下系統(tǒng)學(xué)習(xí)公司技術(shù)棧,包括 Spring Boot 框架核心原理、MyBatis 持久層框架應(yīng)用、MySQL 數(shù)據(jù)庫優(yōu)化技巧等,熟悉自研大數(shù)據(jù)平臺架構(gòu),掌握Git版本控制及代碼規(guī)范;通過參與代碼評審和文檔學(xué)習(xí),快速掌握了公司編碼規(guī)范與開發(fā)流程,RESTFul風(fēng)格開發(fā)。
中期參與公司重點項目 “智能知識圖譜” 的后端開發(fā),負責(zé)數(shù)據(jù)集管理模塊。運用 Spring Cloud 微服務(wù)架構(gòu),設(shè)計并實現(xiàn)了資源查詢、上傳、統(tǒng)計等 多個核心接口,運用線程池加分布式鎖解決了多文件同時調(diào)用算法并把結(jié)果快速反應(yīng)給前端的并發(fā)控制問題。
三、實習(xí)總結(jié)與體會
(一)實習(xí)收獲
1. 專業(yè)技能:熟練運用 Spring Boot、Spring Cloud 等框架進行微服務(wù)開發(fā),掌握分布式事務(wù)處理、服務(wù)熔斷降級等核心技術(shù);精通 MySQL 索引優(yōu)化、SQL 調(diào)優(yōu);具備獨立進行后端接口開發(fā)、測試及問題排查的能力,技術(shù)水平達到初級開發(fā)工程師標準。
2. 工程實踐:深刻理解軟件工程中迭代開發(fā)、測試驅(qū)動等理念,參與完整的項目生命周期,掌握從需求分析到上線運維的全流程實踐經(jīng)驗;熟悉自研大數(shù)據(jù)平臺架構(gòu),掌握Git版本控制及代碼規(guī)范。
3. 綜合能力:提升了跨團隊溝通協(xié)作能力,通過與前端、數(shù)據(jù)團隊的頻繁對接,學(xué)會了用清晰的技術(shù)語言表達需求;培養(yǎng)了問題拆解能力,面對復(fù)雜業(yè)務(wù)場景能快速定位核心問題并制定解決方案。
4. 這段實習(xí)經(jīng)歷不僅豐富了我的專業(yè)知識,提高了實戰(zhàn)能力,更讓我在技術(shù)探索的道路上變得更加勇敢和堅定。我深知,未來的學(xué)習(xí)和工作中仍有無數(shù)未知等待我去探索和征服。我將繼續(xù)保持謙虛和勤奮,不斷學(xué)習(xí)和鉆研,為自己的職業(yè)道路打下堅實的基礎(chǔ)。
(二)遇到的問題及解決方法
問題 1:大文件上傳超時
現(xiàn)象:5GB 以上文件上傳時頻繁觸發(fā)網(wǎng)關(guān)超時。
解決:實現(xiàn)分片上傳(每片 5MB)+ 斷點續(xù)傳,前端通過 WebSocket 實時反饋進度,后端使用 Redis 記錄分片上傳狀態(tài),最終支持 20GB 文件穩(wěn)定上傳。
問題 2:文件 IO 流關(guān)閉異常
現(xiàn)象:高并發(fā)下偶發(fā)文件句柄泄露,導(dǎo)致系統(tǒng)無法創(chuàng)建新文件。
解決:采用 try-with-resources 語法強制資源釋放,結(jié)合定時任務(wù)掃描未關(guān)閉的流,通過 JVM 監(jiān)控工具驗證,使句柄泄露率降為 0。
問題 3:分布式鎖失效
現(xiàn)象:極端情況下出現(xiàn)鎖超時導(dǎo)致的重復(fù)處理解決:實現(xiàn)鎖自動續(xù)期機制(watch dog),結(jié)合 ZooKeeper 實現(xiàn)分布式鎖降級方案,確保臨界區(qū)資源安全。
針對小文件碎片化問題,設(shè)計合并存儲策略,將小于 1MB 的文件打包存儲,減少元數(shù)據(jù)查詢次數(shù),通過 AOP 實現(xiàn)接口訪問日志記錄與異常統(tǒng)一處理,使問題排查效率提升 50%。
(三)感悟
理論學(xué)習(xí)與工程實踐存在顯著差異,課堂上掌握的 Java 語法和數(shù)據(jù)結(jié)構(gòu)知識,需要在實際開發(fā)中結(jié)合業(yè)務(wù)場景靈活運用。大數(shù)據(jù)領(lǐng)域的技術(shù)迭代速度遠超預(yù)期,必須保持持續(xù)學(xué)習(xí)的習(xí)慣才能跟上技術(shù)發(fā)展。團隊協(xié)作中,代碼的可讀性和可維護性比單純實現(xiàn)功能更重要,良好的編碼規(guī)范是提升團隊效率的基礎(chǔ)。
四、總結(jié)與展望
(一)總結(jié)
五個月的實習(xí)讓我從理論學(xué)習(xí)走向工程實踐,在南京云創(chuàng)大數(shù)據(jù)的技術(shù)氛圍中,不僅夯實了后端 Java 開發(fā)技能,更深入理解了大數(shù)據(jù)平臺的架構(gòu)設(shè)計與實現(xiàn)邏輯。通過參與真實項目開發(fā),將軟件工程專業(yè)所學(xué)的需求分析、系統(tǒng)設(shè)計、測試優(yōu)化等知識轉(zhuǎn)化為實際能力,完成了從學(xué)生到準工程師的角色轉(zhuǎn)變。
(二)展望
未來將繼續(xù)深耕 Java 后端開發(fā)領(lǐng)域,重點學(xué)習(xí)分布式系統(tǒng)設(shè)計與大數(shù)據(jù)處理技術(shù),計劃通過架構(gòu)師認證提升技術(shù)深度。同時保持對行業(yè)動態(tài)的關(guān)注,將所學(xué)技術(shù)與實際業(yè)務(wù)場景結(jié)合,努力成長為兼具技術(shù)能力與業(yè)務(wù)思維的開發(fā)工程師。感謝南京云創(chuàng)大數(shù)據(jù)提供的實習(xí)平臺,期待未來能在技術(shù)領(lǐng)域持續(xù)精進,為行業(yè)發(fā)展貢獻力量。