








摘" 要:隨著數字鐵路規劃的提出,對鐵路應用軟件的建設速度與質量要求越來越高。鐵路應用軟件研發面臨的很重要的問題是隊伍水平參差不齊、缺少專業設計人員,產出的軟件產品的用戶界面設計和用戶體驗質量差強人意。該文提出一種借助stable diffusion工具的AIGC能力,按照設計—生成—再優化的步驟,通過正向和反向提示詞、調優參數以及蒙版重繪的手段實現較為高效的產出海報設計,既降低對設計人員的專業要求又節省整體出圖時間。該方法應用在某業務安全日以及中秋節軟件中海報宣傳中,取得很好的效果。
關鍵詞:AIGC;文生圖;提示詞;軟件界面設計;海報設計
中圖分類號:TP311" " " 文獻標志碼:A" " " " " 文章編號:2095-2945(2025)06-0133-05
Abstract: With the proposal of digital railway planning, the requirements for the construction speed and quality of railway application software are becoming increasingly high. The very important problems faced by railway application software research and development are the uneven team level, the lack of professional designers, and the unsatisfactory user interface design and user experience quality of the produced software products. This paper proposes an AIGC capability using the stable diffusion tool to achieve more efficient output poster design through forward and reverse prompts, tuning parameters, and mask redrawing in accordance with the steps of design-generation -reoptimization. It not only reduces the professional requirements for designers but also saves overall drawing time. This method was applied to poster promotion in a business safety day and Mid-Autumn Festival software, which achieved good results.
Keywords: AIGC; Wenshengtu; prompt word; software interface design; poster design
《數字鐵路規劃》作為中國鐵路發展的重大戰略,于2023年下半年正式發布。根據規劃指示:“未來要建設高質量的數字鐵路應用支撐數字化轉型”,因此數字化應用的建設是未來數字化鐵路建設的重要支撐。鐵路信息化經過了40多年的發展已經頗具規模,取得了相當的成績。但總體而言,鐵路信息化水平尤其是軟件研發能力更多地關注“實現功能”的層面,離數字化應用所需要的UI和UX高質量設計尚有不小的距離。
1" 問題的提出
目前鐵路正在運行的信息系統超過2 000個,但大多數是企業內部應用,只注重功能而不注重用戶體驗,信息展示的合理性不足。造成這種情況的重要原因是鐵路軟件研發團隊中產品設計崗人員欠缺,無法支撐“以用戶為中心”的研發要求。
傳統UI設計師主要的工作職責涉及視覺設計、用戶界面設計和制定設計規范三大部分[1],其中視覺設計在視覺設計對于頁面的美觀度、情感化的提升是非常顯著和重要的,是最能體現設計師創意和專業能力的。軟件設計階段的視覺設計的工作量是非常大的,一部分原因是營銷運營的活動場景通常需要圖片配合文案經常變動,且時間節點要求比較嚴格;另外是由于單場活動的出圖量大。比如為了配合某一主題的營銷活動,除了主視覺的設計需要設計人員的創意能力之外,根據線上終端和展示位的差異,線下物料打印尺寸等不同,還要花費大量的時間把設計好的主視覺做設計圖的微調和適配工作。
進入2023年以來,以ChatGPT為代表的生成式人工智能(Artificial Intelligence Generated Content,AIGC)和大模型能力迅速發展,取得了一系列研究成果。文獻[2]探討了AIGC的發展歷程,以及在設計行業的應用場景,包括廣告設計、動畫設計、游戲設計中的應用;文獻[3]探討了AIGC繪圖工具在UI界面設計中的應用;文獻[4]介紹了AIGC用于在服裝設計圖案的精細調色、色彩搭配的優化以及材料選擇的創新等;文獻[5]對stable diffusion和Midjourney 2個以繪畫為核心主導的 AIGC 模型的動態圖形設計進行介紹并給出了簡要示例;文獻[6]設計了基于AIGC常用模型的生成流程;文獻[7]使用ChatGPT和Midjourney生成家居設計效果圖,并指出了生成過程的不可預測性等問題;文獻[8]使用Stable Diffusion生成虛擬人像,并對不同采樣參數和采樣方法的效果給出了說明與展示。
本文借助本地化模型Stable Diffusion能力,結合鐵路應用軟件設計風格,設計了一套適合鐵路海報圖的提示詞,用于鐵路元素海報的快速生成。
2" 基于AIGC的鐵路軟件UI設計方案
2.1" AIGC方案選擇
AIGC與傳統的任務導向型人工智能系統不同,生成式人工智能更加注重創造性和自主性[9]。AIGC通過算法和數據驅動,利用計算機視覺、機器學習和生成式對抗網絡等領域的技術,實現對圖形和內容的智能處理和生成。通過AIGC的規?;\用能以更快捷高效的方式完成以往比較復雜的創作過程,部分甚至完全取代已有的一些“人”的工作。
目前在AI繪圖領域最知名的兩大主流工具是Midjourney與Stable Diffusion。Midjourney是一款商業化產品,特點是上手難度較低、出圖質量高,服務是端對端的形式,能夠基于一個大模型快速響應各種風格或內容關鍵詞的繪制,但受限于使用成本和無法私有化部署,不適合鐵路應用軟件設計。Stable Diffusion是開源基于擴散模型的文生圖AI工具[10],可以生成高質量和高分辨率圖像,但上手難度較大且對服務器配置要求較高。
Stable Diffusion webUI支持本地部署,支持的操作系統包括Windows、MacOS和Linux。在Windows上部署webUI需安裝Python、CUDA和Git,以確保webUI的正常運行。本文使用的主機硬件配置見表1。
本文以軟件中海報設計為案例,以“4.28世界安全生產與健康日”為主題,突出鐵路職工時刻牢記安全為鐵路生產與運營的第一要務,確保廣大旅客生命財產安全。在構思方面,希望以手繪風格展示一位穿著安全制服的鐵路職工在鐵路站臺做安全巡視,配圖文字為“加強鐵路運輸安全,保障群眾生命財產”。
2.2" 基本流程
在Stable Diffusion中有文生圖和圖生圖2種繪圖模式,基礎的操作流程可分成4步,如圖1所示。
最終的出圖效果是由模型、提示詞、參數設置三者共同決定的,缺一不可。其中,模型對畫面的風格影響最大,提示詞描述影響畫面生成哪些內容,而參數則主要用于精細化控制畫面的更多細節。圖像生成后根據效果需要進一步優化和調整提示詞以及調優參數。
SD的模型分為官方大模型和定制模型。官方模型雖然強大,但由于它的根本目的是通過預訓練學習海量的圖像數據從而提升模型整體的基礎認知力,所以直接用官方大模型往往不能滿足對細節和特定內容的專業繪圖需求。它的真正價值在于降低了模型訓練的門檻。相比之下針對特定方向訓練的定制模型的理解和繪圖能力更強,實際的出圖效果反而有了極大的提升。工作中可以根據實際需要在開源社區中下載的定制模型安裝使用或者根據需求訓練鐵路自己的模型使用。
提示詞是用來調節繪圖模型的一種方法,通過輸入想要的內容和效果,讓模型理解用戶表達的含義,從而實現更準確的出圖效果。Stable Diffusion提示詞包括Prompt(正向提示詞)和Negative prompt(反向提示詞)。正向提示詞用于描述想要生成的圖像內容,而反向關鍵詞用于控制不想出現在圖像中的元素。提示詞全部只支持用英文輸入,只需要用詞組描述中間用逗號隔開,順序越靠前的詞組權重越高。輸入時沒有嚴格的語法結構,不同模型對提示詞的敏感度也不同,因此需要設計師不斷探索,結合模型特點靈活書寫提示詞的內容。
2.3" 模型選擇
首先根據想要的海報風格選擇適合的定制模型,一般常見的定制模型可以分為2D風格、3D寫實風格兩大類。本文選擇的定制模型為babes20Half.ewU1,與該模型相關的配置參數如下。Steps為25,Sampler為DPM++ 3M SDE Karras,CFG scale為7,Size為512×768。
2.4" 提示詞設計
正向提示詞根據所要表現的內容進行設計,可以套用公式:主體物+構成+環境色+質量+風格。經過多次驗證,表2為滿足需求的提示詞組合。
2.5" 生成圖像
基于設計好的提示詞以及模型的默認參數,生成了若干張備選圖,在其中選取構圖、人物以及火車等主體最能表達原始需求需求的如圖2所示??梢钥吹綀D2中雖然整體看起來還可以,但細節上有一些比較明顯的錯誤:臉部和手的崩壞比較嚴重,鐵軌的比例細節有一些錯誤。接下來需要進一步將利用Stable Diffusion 的局部重繪能力修復圖片中有問題的細節。
2.6" 局部重繪與調優
2.6.1" 遮蓋重繪
局部重繪可以最大限度保留圖像中合理部分的前提下,對需要優化的區域進行重新繪制。因此,需要運用手涂蒙版將有待重新生成的區域遮蓋起來,每次只遮蓋一個區域。本圖中需要修復的區域包括面部、手部、鐵軌幾處細節,采用分別遮蓋并執行二次重繪。
2.6.2" 參數調優
配合蒙版的遮蓋重繪,還需要調整模型的若干參數,使得重繪的效果更為理想。參數中對重繪影響比較大的幾個參數包括:縮放模式、蒙版模式、采樣方法、采樣迭代步數和重繪幅度等,其中將采樣迭代步數降低調整為22,重繪幅度增加調整為0.72,如圖3所示。
2.6.3" 反向提示詞設計
經過初步驗證,僅通過正向提示詞信息的調整效果并不理想。最終采用了“蒙版+反向提示詞”結合的方案:首先把透視比例錯誤的鐵軌,以及不真實的人物臉部和手部使用蒙版涂抹遮蓋;接下來在提示詞中添加如下反向提示詞,見表3。
經過上述配置以后,重新生成圖像,效果如圖4所示。
2.7" 海報制作
圖4的效果已經非常接近預期了,沒有明顯的缺陷,可以作為成圖并進一步加工。最終生成的海報成圖如圖5所示。按照上述選取模型—提示詞設計—成圖—優化—再成圖的工作思路,可以很快地完成若干應用軟件中若干海報的設計工作。
利用AIGC的能力輔助設計海報的案例實踐,可以形成運營物料的一套通用解決方案。利用以上的思路和方法,可以嘗試運用AIGC解決客、貨運,國鐵商城等業務在各大節假日、宣傳日等常見場景線上線下的宣傳物料的快速設計和出圖。解決鐵路軟件研發團隊缺少專業設計人員,以及設計能力不足的問題。圖6為利用AIGC制作的中秋節運營海報,畫面主體表現的是中秋節親人搭乘火車趕回一家人團聚的歡樂氛圍,文案為“月滿中秋,中國鐵路助力團圓”。
3" 結束語
盡管AIGC在設計領域尚處于早期階段,但已經展現出對軟件設計帶來實質性提升和變革的潛力。通過利用人工智能工具,設計師們可以更快速地生成創意、優化設計,并在不斷的實驗中不斷改進。隨著算力不斷提升,將能夠以更快的速度生成大量的設計作品。同時,AIGC也有不足之處,其對于具象的需求表現得要好于對抽象需求表現,AIGC繪畫無法穩定地繪制出抽象統一的相機圖標,但可以快而穩定地繪制出一個精美寫實的單反相機圖片。而人的優勢恰恰在于把復雜的設計需求抽象和解構,同時對于需求是否被滿足有著審美和判斷,兩者協作各自發揮優勢將是未來希望達到的設計模式。
參考文獻:
[1] 李翰林,姜勇.計算機圖像處理技術在UI設計中的應用[J].電子測試,2021(10):117-118.
[2] 徐暢,杜欣澤,于凱迪.AIGC在設計行業應用中的挑戰與策略[J].人工智能,2023(4):51-60.
[3] 王蕾.AIGC繪圖工具在UI界面設計中的應用探析[J].電腦知識與技術,2023,19(26):108-111.
[4] 劉曉宇.AIGC在時尚服裝設計中的創作輔助研究[J].染整技術,2024,46(3):63-65.
[5] 張福也.AIGC技術在動態圖形設計中的影響[J].絲網印刷,
2023(12):97-99.
[6] 孫瑒,陳品,王強.圖標設計整合AIGC技術的可行性研究[J].包裝世界,2023(9):49-51.
[7] 陳園,方慶寧,熊芷璇,等.ChatGPT和MJ在家居設計領域應用的機遇與挑戰[J].家具與室內裝飾,2023,30(12):51-55.
[8] 曾建勇,沈曉萍.基于Stable Diffusion的虛擬人形象預設計的應用與研究[J].現代信息科技,2024,8(3):169-175.
[9] 許雪晨,田侃,李文軍.新一代人工智能技術(AIGC):發展演進、產業機遇及前景展望[J].產業經濟評論,2023(4):5-22.
[10] 何結平.人工智能繪畫生成工具Stable Diffusion視角下平面設計發展研究[J].科技經濟市場,2023(11):45-47.
基金項目:中國國家鐵路集團有限公司科技研究開發計劃重大課題(K2023S008-A(JB))
第一作者簡介:張鶴(1993-),女,助理研究員。研究方向為用戶體驗設計、智能化UI。
*通信作者:王喆(1981-),男,博士,副研究員。研究方向為DevSecOps、云原生技術。